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Előszó 


Ma, amikor az információ és a tudás a legfontosabb erőforrássá kezd válni, kü- 
lönősen felértékelődik az a képesség, amely (nagy) adatbázisok tervezésére, meg- 
valósítására és/vagy hatékony lekérdezésére tesz valakit alkalmassá. Ilyen céllal 
már számos jegyzet, könyv íródott, a jelenlegi azonban kifejezetten a Budapcsti 
Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar 
Műszaki informatika szakos hallgatói számára készült, ugyanis a felépítése az ő 
előképzettségükhöz és igényeikhez igazodik. Ennek megfelelően célja nem a napra. 
kész gyakorlati ismeretek átadása, hanem olyan elméleti alapok nyújtása, amelyek 
egy-egy konkrét megvalósítástól függetlenek, és olyan alapokat jelentenek, ame- 
lyek széles körben megkönnyítik az adatbázis-kezelők működésének, felépítésének 
megértését, lasználatuknak a hatékony elsajátítását. Ezt szolgálja a példatár ís, 
amely megmutatja, hogy a leírt elmélet elemeit milyen módon lehet gyakorlati 
problémák megoldására felhasználni. 


Az adatbázisok gazdag és folyamatosan bővülő témakörcinek a leírtak természe- 
tesen csak egy (szűk) részét képezik, hiszen egyetlen félév anyagába kel minden- 
nek beleférnie. A bővítés - és a technológiai fejlődés - legfontosabb irányait 
(szemistrukturált adatkezelés, NOSOL adatbázis-kezelők) a függelékekbe szorult 
fejezetek mutatják. 


Jelen mű nem előzmények nélküli, közvetlen elődjének egy Microsoft Wordben 
készült jegyzet tekinthető. Lelkcs és tehetséges hallgatók azonban jó pár hónapja 
rávottek arra, hogy ez a könyv már inkább IATEX-ben készüljön, és ennek érde- 
kében teljes mértékben magukra vállalták a konvertálás fcladatait. Noha sejthető 
volt, hogy a szükséges ráfordítás irreálisan magas lesz a várható előnyökhöz képcst, 
nem tudtam lebeszélni őket. Ezért a könyv esztétikai szépsége elsősorban nekik 
köszönhető: az ő kitartásukat dicséri, hogy szebbek lettek a betűk, határozottan 
elválnak egymástól a definíciók, példák, magyarázatok, tételek, bizonyítások; el- 
készült egy magyar-angol tárgymutató, továbbá számos helyen pontosítottunk n 
szövegezésen. Mindezek a tanulás segítését célozzák az olvashatóság javításán, il). 
a nem egyértelmű megfogalmazások megszüntetésén fcsökkentésén keresztül. 


Ezért ezúton is hálás köszönetemet fejezem ki korábbi hallgatóimnak, akik áldoza- 
tos rnunkája nélkül ez a mű ebben a formában nem jelenhetett volna meg: Szárnyas 
Gábor, Stcin Dániel, Szepcs Nóra, Marton József, Darvas Dániel, Kocsány Dóra, 
Sebők Márton, Horváth Benedek, Frigó Erzsébet és Búr Márton vettek részt az 
elkészítésében. 


A konverzió sajnos rengeteg manuális beavatkozást is igényelt, ezért óbatatlanul 
megjelenhetnek új sajtóhibák is. Előre is köszönöm, ha az Olvasó megosztja ezeket 
vagy egyéb észrevételeit velünk a https://yvww.db.bne.hu/sajtobibak címen 
keresztül annak érdekében, hogy a következő kiadásban ezek már ne maradjanak 
benne, ill. a javaslatokat figyelembe vehessük. 


Budapcst, 2015. augusztus 
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Bevezetés 


Adatok gyors, gépcsített tárolásának és visszakercsésének igénye már akkor felme- 
rült, amikor még csak (elektro-jmechanikus számológépek léteztek, A népesség- 
nyilvántartásban kezdetben ,lyukkártyás tabulátorokat" alkalmaztak (, Holleríth 
kártyák"), amelyek ősi adatbázis-kezelőknek tekintbetők. Egy kártya cgy rekord 
adatait - 80 karaktert — tárolta. Bár korukban óriási előrelépést jelentettek, még- 
sem nebéz elképzelni, hogy mennyi probléma lehetett ezekkel a szerkezetekkel. 
Ennek ellenére, amikor megjelentek az első elekironikus, mágnesszalagos háttér- 
tárat alkalmazó adatbázis-kezelők, alapvetően a kártyás működést utánozták. Ma, 
2016-ban a soros helyett közvetlen hozzáférésű háttértárak (mágncslemezek, op- 
tikai tárak, sőt egyre inkább a félvezető alapú nem felejtő tárak) dominálnak, és 
az egykori kártyás adattárolóra na mai számítógépek már egyáltalán nem hasonlí- 
tanak, azonban nz adatbázis-kezelők dominánsan rekordoricntált szemlélete máig 
megmaradt (de: Id. a NOSOL adatbázis-kezelőkről szóló C. függeléket). Az elekt- 
ronikus számítógépek elsősorban sebességükben hoztak újot, továbbá abban, hogy 
velük a rekordok, ill. rekord típusok között változatos kapcsolatok nlakíthatók ki, 
más szavakknl: az adatbázis logikai és fizikai struktúrája tetszőlegesen bonyolulttá 
tehető, ami változatosabb és bonyolultabb lekérdezések hatékony végrehajtását ís 
lehetővé teszi. 


Az első nem szekvenciális hozzáférést biztosító fájlrendszert 1959-ben fejlesztették 
ki az IBM-nél. Az 1960-as években egy sor új, harmadik generációsnak nevezett 
programozási nyelv jelent meg, mint a Fortran, Basic, PL1, melyek között volt 
egy, a COBOL, amely egyenesen adatkezelés-orientált céllal jött létre. (Egyes stn- 
tisztikák szerint az ndatbázis-alkalmazások nagy része a 90-cs években is még 
ezen a nyelven készült, megelőzve a C, Crr nyelveket is, amiket inkább rendszer- 
fejlesztésre használnak.) Nem sokkal ezután megjelentek az első adatbázis-kezelő 
rendszerek is, melyek a fájlkezelőkből alakultak ki, azok szerves folytatásaként. 
1961-ben dolgozták ki a hálós adatmodoli alapjait, majd nem sokkal rá létrejött 
a hierarchikus adatmodell is. Az első hálózatos, konkuréns hozzáférést biztosító 
adatbázis 1965-től működött az IBM-nél, és a SABRE nevet kapta. Az induló 
időszak hierarchikus, majd hálós adatmodelljei után az 1970-es években indult cl 
hódító útjára a ma legelterjedtebb relációs adatbázis-kezelés. Áz adatbázisokkal 
kapcsolatos elméleti kutatások is megszaporodtak, az 1970-cs években indultak 
be a témához kapcsolódó neves konferenciák (VLDB, Very Large Data Bascs és 
SIGMOD, Special Interest Group on Management of Data). Az 1980-as években a 
relációs adatbázis-kezelők SOL kezelőfelülete is szabvánnyá vált, és megjelentek a 
relációs adatbázist kezelő alkalmazások hatékony fejlesztését szolgáló negyedik ge- 
nerációs, 4GL rendszerek ís. A XX. század utolsó évtizedében az adatbázis-kezelés 
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területén is tért hódítottak az új elvek, mint az objektumorientáltság vagy a logikai 
programozás, a hálózatok elterjedésével az elosztott adatbázis-kezelők jelentősége 
is növekszik. Emellett egyre nagyobb szerepet kapnak a strukturált adatkezeléstől 
eltérő felépítésű és funkciójú, szövegszerű kezelést megvalósító (szemistrukturált, 
ill. strukturálatlan adatokon dolgozó, ld. B. függelék) információs rendszerek is, 
mint ahogyan az adatok kezelése helyett egyre fontosabbá válik az ,értelmezett 
adat" (információ), ill. a tudás (kontextusba helyzett információ) kezelése (ld. 
tudásbázisok). A XXI. század elején pedig petabájtos adatmennyiségeket perzisz- 
tensen tárolni tudó, de csak korlátozott lekérdezhetőséget támogató rendszerek 
hódítanak (ld. pl. Yahoo!, Twitter, Facebook). Természetesen czek a korlátok csak 
átmenetiek, mára - állítólag — elkészült az első, akár yottabájt (10"1) mennyisé- 
gűl, n legkülönbözőbb forrásból származó és típusú adatot (szöveg, szám, hang, 
kép, video) egyaránt feldolgozni képes adatbázis az USA Nemzetbiztonsági Hi- 
vatala (NSA) számára.? Az adatok sok ternbájtnyi hányada már folyamatosan a 
memóriában található, ari ezekhez az ndatokboz való hozzáférést több nagyság- 
renddel gyorsítja meg ahhoz képest, mintha azokat mágnes- vagy optikoi lemezen 
tárolnánk (Id. memóőriarczídens adattázis, IMDB). 


Itt tartunk most... 


Ennek a nagyságát segít elképzelni, ha tudjuk, hogy a teljes világháló forgalma 2010-ben 
acsak" mintegy 250 exabájt (250 x 10" bájt) volt. 
A borítón az NSA adatközpontja látható (Utah Data Center, UDC) Bluffdatc-ben (Salt Lake 
Citytőb délre). Forrás: Wikipedia, 
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1. fejezet 


Alapfogalmak 


Adatbázisnak a valós világ egy részhalmazának leírásához használt adatok össze- 
függő, rendszerezett halmazát nevezzük. Ma czek többé-kevésbé állandó formában 
egy számítógép háttértárolóján tárolódnak. 


Azt a hardver-szoltver rendszert, amcly egy vagy több személy számára magos 
színten teszi lehetővé ezen adatok olvasását vagy módosítását, adatbázis-kezelő 
rendszernek (database management system, DBMS) nevezzük. Az adatbázis- 
kezelőt alapvetően jellemző tulajdonságok: 


- nagy Adotmennyiség, 
- gazdag struktúra és 
- hosszú életeiklus. 


Az adatbázis-kezelő rendszerek adatait (még) ma (2016) is túlnyomórészt merév]e- 
mezcs mágneses háttértárakon (hard disk drive, IDD, , winchester") tárolják, ki- 
sebb részben mágnesszalagon, optikni lemezen, de rohamosan növekvő hányadban 
félvezető alapú memóriában is, beleértve a szílárdtest-meghajtókat (solid-statc 
drive, SSD)! ís. Így jelen jegyzetben a mágneslemezes háttértárak alkalmazására, 
sajátosságaira koncentrálunk. Az adatbázis-kezelő gazdag struktúrájn azt jelenti, 
hogy a tárolt rekordok között változatos logikai kapcsolatok hozhatók létre, ame- 
lyek meghatározott adatbázis-műveleteket megkönnyíthetnek (értsd: meggyorsít- 
hatnak). Egyes adatbázis-kezelők bízonyos logikai kapcsolatokat megengedhetnek 
az adatok között, másokat nem, így különböző adatmodelleken (Id. 4.1. szakasz) 
alapulhatnak. Hosszú életciklusuk legjobban talán a népességi adatbázisok példá- 
jával szemléltethető, amelyeknek tetszőlegesen hosszú időt és ígen sok technológiai 
váltást is túl kell élniük mindaddig, amíg népességi adatbázisokra egyáltalán szük- 
ség van. 

Az adatok kezelésének magas szintje azt jelenti, hogy az adatbázis-kezelő úgy 
működik (működhet), hogy a felhasználó anélkül tudja előírni a teendőket, hogy az 
! Olyan adattároló eszköz, nmely blokkos elérést (td. 3. fejezet) biztosít nz adatokhoz, és a 
tápellátás megszűnése esetén sem veszíti el azokat. 
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adatbázis-kezelő algoritmusairól vagy az adatok (fizikni) tárolási elvéről ismeretei 
lennének. 


A továbbiakban megvizsgáljuk, hogy melyek a különböző adatbázis-kezelők fon- 
tosabb közös vonásai. 


1.1. A programozó és a felhasználó kapcsolata az 
adatbázis-kezelő rendszerrel 


Az 1.1. ábra egy DBMS általános felépítését és környezetét mutatja be. 


A ,klasszikus" adatbázis-kezelő rendszerek használatának alapvetően két fázisa 
különül el. Először meg kell határozni az adatok majdani tárolásának logikai 
rendjét: ez az adatbázis (fogalmi) vázának, vagy más szóval sérnájának vagy struk- 
túrájának megteremtését jelenti (1. fázis). Ennek az adatai (mint ún. technikni 
metaadatok) az adatbázisnak egy különösen védett részében kerülnek tárolásra, 
hiszen az elvesztésük/sérülésük a teljes adatbázis tartalmát hozzáférhetetlenné te- 
szi, Csak ezután van lehetőség az adatbázist adatok tárolására használatba venni, 
adatokkal feltölteni, majd az adatoknt különböző szempontok szerint visszake- 
resni (2. Fázis). Ez utóbbi történhet úgy, hogy egy (képzett) személy speciális 
adatbázis lekérdező nyelven kérdéseket fogalmaz meg, melyeket egy interpreter 
azonnal értelmez és az adatbázis-kezelő válaszol rá. Másrészt, a lekérdezések ön 
álló programként vagy egy alkalmazás (applikáció) részeként is megfogalmazód- 
hatnak, Mindkét esetben egy interpreter, egy lekérdezésfeldolgozó alakítja azokat 
a adatbásis-menedzser által értelmezhető formába. Eközben általában a lekérde- 
zés opntimatizálása is megtörténik, hiszen egy-egy végeredményhez gyakran több 
núton" (műveletek különböző sorozatán keresztül) is eljuthatunk, nmelyek számí 
tásigénye azonban akár nagyságrendileg is különbözhet. 


Felhasználói 
lekérdezés 


Lekérdezésfeldolgozó Sémafordító 
DBMS Adatbázis-menedzser 







Sémaleírás 








fizikal adatbázis (DB) 


1.1. ábra. A DBMS és környezete 
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Az 1. fázist egy speciális nyelv, az ún. adatdefiníciós nyelv (data definition 
language, DDL) támogatja, amellyel tehát megfogalmazhatjuk, hogy milyen adn- 
tokat milyen formában fogunk az adatbázisban tárolni. A sémafordító értelmezi 
az adatbázisnak ezt a logikat (fogalmi) teírását és külön fordítja le. Az adatbázis 
használatához, a 2. (ázishoz a lefordított séma mindig rendelkezésre kell, hogy 
álljon. Ez olyan az adatbázis-menedzser számára, mint egy program deklaráci- 
ós része. A 2. fázisnak is saját nyelve van: ez az adatlekérdező és -inanipulációs 
nyelv (data manipulation language, DML). A DML és a DDL az adatbázis-kezelés 
hőskorában határozottan szétvált egymástól, de az utóbbi időben gyakran jelen- 
nek meg egy egységes nyelvként, mint pl. n szabványosított SOL nyelvben (ld. 
5.4. szakasz). 


A DBMS központi része az adatbázis-menedzser (database manager), amely a le- 
fordított sémn alapján kezeli a felhasználói lekérdezéseket és olyan további feladn- 
tokat is ellát, mint a felhasználói hozzátérés-védelem, az adatbiztonság, a szink- 
ronizáció és az integritás megteremtése (ld. 1.2. szakasz). 


Az állománykezelő (file manager) biztosítja a hozzáférést a fizikni adatbázishoz, és 
általában szoros kapcsolatban van az operációs rendszerrel. Egyszerűbb esetben 
annak számos szolgáltatását használhatja, de ennél többet ís elvárhatunk tőle, ha 
figyelembe vesszük a későbbiekben megismerendő speciális állományszerkezeteket 
(Id. 3. fejezet). Az adatbázíisokban nz adatvesztés veszélye miatt az adatokat vé- 
göl mindíg valamilyen perzisztens tárolást biztosító eszközre ís ki kel) (rni (ld. 
tt 10.I. szakasz, ACID tulajdonságok). 


Adatdázis (database, DB) alatt általában csupán a fizikai adatbázist értjük. 


1.2. Járulékos feladatok 


Az adatbázis-kezelőtől néhány egyéb feladat megoldását is elvárjuk. Az olábbiak- 
ban felsoroltakat elsősorban az I.1. ábra adotbázís-menedzsere valósítja meg. 


1.2.1. Adatvédelem (privacy) 


Nem minden felhasználó férhet hozzá minden tárolt adathoz. A hozzáférés módja 
is lehet különböző az egyes felhasználóknál: azok az adatok, amelyeket az egyik 
felhasználó kedvére módosíthat, egy másik számára esetleg csak olvasásra hozzá- 
férhetőek, vagy egyáltalán nem (id. pl. a személyes adatokat, mint tipikus, különö- 
sen érzékeny adatokat). Gyakran jelszóhoz kötik az elérés jogának megszerzését, 
de bonyolultabb módszerek, pl. célhardver ís támogathatja az adatok védelmét. 


1.2.2. Adatbíztonság (security) 


Bizonyos adatbázisokban a tárolt adatok igen nagy értéket képviselhetnek, így 
megsemmisülésük, vagy akár részleges megsérülésük semmiképpen nem megen- 
gedett, még szélsőséges körülmények esetén (elemi csapás, adathordozó ellopása, 
rendszerhiba stb.) sem. Ennek biztosításához különleges eljárásokra van szükség, 
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mint pl. naplózás, rendszeres mentések, kettőzött adatállományok, elosztott mű- 
ködés stb. (ld. 10. fejezet). 


1.2.3. Integritás (integrity) 


Fontos, hogy legyen olyan bcépített szolgáltatás, amely segítségével az adatbázis 
adatainnk , helyessége", ellentmondás-mentessége - azaz integritása — ellenőrízhe- 
tő, mivel a beszúrás, törlés, módosítás funkciók kénycsek a sikercs végrehajtásra. 
Szerencsés, ha a DBMS már az adatbevitel során minél szélesebb körben képes 
az integritást sértő műveletek megakadályozására, gyakran azonban az adatbá- 
zis alkalmazásokra hárul ennek a feladatnak egy része." Sőt - látni fogjuk -, az 
adatbázis logikai felépítése ís jelentősen elősegítheti az integritás megörzését. Az 
integritásnak számos foka és ennek megfelelő típusa létezik. Itt csak hármat em- 
lítünk meg. 


A formai ellenőrzés viszonylag egyszerűbb feladat. Ezalatt azt értjük, hogy egy 
adott mezőben valóban az ott engedélyezett érték áll-e. Árulkodó jel, ha egy csa- 
ládnév pontosvesszőt tartalmaz, vagy egy személy testmagassága három és fél 
méter (domain sértés). 


Számos csetben kell nnnak a feltételnek teljesülnie, hogy az adatbázisból az egyik 
helyről kiolvasott adatelemnek meg kell egyeznie valamely más helyről kiolvasott 
másik adatelemmel (referenciális integritás). 


Sokkal bonyolultabb kérdés n strukturális integritás ellenőrzése. Ezalatt azt kell 
értenünk és ellenőriznünk, hogy nem sérült-e meg valamely feltételezés, amelyre az 
adotbázis szerkezetének megtervezésekor építettünk. A leggyakrabban előforduló 
ilyen hiba az előzetesen feltételezett egyértelműség megszűnése, Például probléma 
lehet nem mohamedán országokban, ha egy férfiról egyidejűleg két érvényes be- 
jegyzés van különböző feleségekkel. De ide tartozik az összes olyan adatbáziskény- 
szer (dota constrnint) (Id. még 9.2.2. alszakasz) ís, amelyek miatt pl. az adatbá- 
zisban található adatok között bármiféle kapcsolat van. Ezek a kapcsolatok olykor 
nyilvánvalóak (mint pl. az előző példában), máskor jóval kevésbé azok. Az utóbbi- 
ak közé tartoznak a függőségek különböző fajtái, amikor egyes adatbázis-értékek 
megbatároznak más adatbázisbeli értékeket, 


1.2.4. Szinkronitás (synehronization, synehronism) 


A ma használatos adatbázis-kezelő rendszerek általában többfelhasználósak (ld. 
10. fejezet), és egyre gyakrabban térben elosztottan (ld. 11. fejezet), egy 
számítógép-hálózotnak megfelelően üzemelnek. 


Fontos, hogy az azonos adatokon közel egyidőben műveleteket végző felhasználók 
beavatkozásainak ne legyenek nemkívánatos mellékhatásai egymás tevékenységére, 


? Vannak olyan, széles körben elterjedt (pl. ERP, CRM családjába tartozó) alkalmozások/rend- 


szerek, amelyeknek sokféle adatbázis-kezetővel kel) együttműködniük. Az adatbázis-kezelők 
különbözöségei miatt szinte semmit nem használnak ki nzok beépített (gazdag) lehetőségei- 
ből, színte csak rekordmenedzsernek basználják őket. 
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illetve az adatbázis tartalmára. Ezt n tranzakciókezetés (transaction proccssing) 
fogalmába tartozó módszerek képesek biztosítani jól bevált eszközök - pl. sárak 
(lockok) — rendszerével. 


1.3. Az adatbázissal kapcsolatos tevékenységek szintjei 


Az adatbázissal kapcsolatba kerülő személyek tevékenységük szerint négy jelleg-" 
zetes csoportba tartozhatnak. 


Képzetlen felhasználó (naive user): A felhasználók legszélesebb rétege, nkik 
csak bizonyos betanult ismeretekkel rendelkeznek a rendszerről (pl. légitár- 
saság alkalmazottja, nmikor helyet foglal egy járatra), vagy még ennyivel 
sem (pl. webes áruház katalógus nézegetője). 

Alkalmazásprogramozó (application programmer): Az a szakember, aki a 

(képzetlen) felhasználó által használt programot. készíti és karbantartja. 
Szaktudásánál fogva ismeri azt a nyelvet, amely lehetővé teszi az ndatbázis- 
ban tárolt adatok ílegalább) logikai szintű (Id. 2. fejezet) elérését. 
Ez olyan feladat, amely programozót igényel, de megoldásához nem feltét- 
lenül szükséges, hogy az illető belelásson az adatbázis belső szerkezetébe is, 
és egyáltalán nem szükséges, hogy a szerkezetet (a tárolt ndatok megőrzése 
mellett) módosítani tudja. 

Adatbázis adminisztrátor (database administrator): Hagyományosnn Így 
nevezzük azt a személyt, aki az adatbázis fclett gyakorlatilag korlátlan jo- 
gokkal bír. Vannak olynn kitüntetett tevékenységek, amelyeket kizárólag ő 
végezhet el az adatbázison, mint pl.; 


- Generálás. Az ndntbázis létrehozása (, felállítása"), szerkezetének ki- 
jelölése, és annak meghatározása, hogy milyen állomány-szerkezetben 
tároljuk az adatokat. 

- Jogosultságok karbantartása, A hozzáférések jogának naprakészen tar- 
tása, módosítása. 

- Szerkezelmódosítás. Az ndatbázis eredeti szerkezetének módosításn. Ez 
feltételezi azt az alapvető igényt, hogy eközben egyetlen adat se semini- 
süljön meg azért, mert pl. a régi adatok mellé újabbakat ís felveszünk 
a tárolandók közé. 

- Mentés-visszaáttlítás. Célszerű lehet adatbiztonsági okokból időnként 
vagy bizonyos időközönként másolatot készíteni az adatbázísról. Ha az 
adatbázis megsérül, ez a másolat teszi lehetővé a visszaállítást a mentés 
időpontjának állapotába, A mentést alkalmas célprogram felhasználá- 
sával bárki elvégezheti, de a visszaállítás nagy körültekintést igénylő 
feladat. : 


DBMS tervező/programozó (DBMS designer/programmer): Tudja, ho- 
gyan kell DBMS-t készíteni, ami különösen specializált tudást igényel. 
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1.4. A fejezet új fogalmai 


adat, információ, tudás, (fizikai) adatbázis, adatbázis-kezelő rendszer, adatbázis 
alkalmazás, metandat, adatbázis séma, sérmafordító, DML, DDL, állománykezelő, 
SOL, lekérdezés feldolgozás, adatbiztonság, szinkronizálás, integritás, adatstruk- 
túra, strukturált adat, szemistrukturált adat, nemstrukturált adat, adatszótár, 
adatbázis adminisztrátor 
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2. fejezet 


Az adatbázis-kezelők felépítése 


A mai adatbázis-kezelők bonyolult hardver-szoítver rendszerek. Kornplcxitásuk 
az operációs rendszerekével összemérhető, söt, gyakran nagyobb annál. Egy ilyen 
rendszer megtervezése, implementálása és karbantartása nem egyszerű feladat, 
amelyre kiánomult módszerek léteznek. Isrnertetésük túlmutat e jegyzet kerete- 
in, itt csak a legfontosabb modellezési, tervezést segítő elvek bemutatására van 
lehetőség. 


Mint a mérnöki gyakorlatban olyan sok más helyen, ítt is eredményes a rétegezési 
koncepció, vagyis egy rétegmodett (Inyered model) alkalmazása. Az alapgondolat 
az, hogy az eredeti problémát több részre kell bontani úgy, hogy az egyes részek 
egymásra épüljenek, de egymással csak minél kísebb felületen érintkezzenek. Jól 
ismert példa minderre a számítógép-hálózatok 150-OSI modellje (11]. IMasonló 
modell, sőt modellek léteznek az odatbázis-kezelők számára ís: a legegyszerübb 
3 rétegűtől kezdve a 7 rétegű modellig. Jelen jegyzetben részletesebben egy 3 
rétegűvel isinerkedünk meg (2.1. ábra). 


A legalsó réteg a fizikat adatbázis (physica) database). Itt valósul meg az ndatbázis 
adatainak a fizikni tárolókon való elhelyezése. Ide értjük azokat nz ndatstruktú- 
rákat ís, amelyekben a (fizikai) adattárolás megvalósul (ld. 3. fejezet). Ehhez a 
réteghez tartozó fogalmak: kötet, állomány, biokk, track, szektor, vödrös hashíng 
(Id. 3.2. szakasz) stb. 








Nézet 1 


Fogalmi adatbázis 


Fizikai adatbázis 


2.1. ábra. Adatbázis-kezelők 3 rétegű architektúrája 
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Középen helyezkedik el a fogalmi (logikai) adatbázis (conceptual (logical) databa- 
sc). Ez nem más, mint a való világ egy darabjának leképezése, egy sajátos modell, 
ahogyan az adatbázis tükrözi a valóság egy részét. A fogalmi adatbázis van Szoro- 
sabb kapcsolatban azzal, ahogyan az adatokat értelmezni kelt, Pl. egy könyvtári 
adatbázisban íde tartoznak a következők: a kölcsönző személyek neve, kölcsönző- 
jegyének száma, egy kötet lelőhelye, ETŐ-szárna, példányszáma, címe, szerzője, 
kiadója, értéke stb. A fogalmi adatbázishoz tartozó sémát fogalmi ftogikat) sémá. 
nak (conceptual (logical) schema) nevezik. 


Néset (view) az, amít és ahogy a felhasználó az adatbázisból lát. Ha az adatbázis- 
nak több felhasználási tehetősége van, ezek mindegyikéhez külön nézet tartozhat. 
Ez lehet a felhasználók jogosítványaihoz kötött is. (Pl. a légítársaság egységes nyil- 
vántartásából más adatok érdekesek, ha a pilóták szabadságolási tervét készítjük, 
és az adatok másik körére van szükségünk, ha egy gép utaslistáját akarjuk megte- 
kinteni.) A nézetekhez tartozó sémákat gyakran külső sémának (external schemna) 
is nevezik. 

Minden jól megtervezett, a rétegezési koncepció alapján felépített rendszerben 
cél az, hogy a rétegek egymástól függetlenül megváltoztathatók, kicserélhetők le- 
gyenek, amennyiben a rétegek közötti interfészek változatlanok maradnak. Az 
adatbázis-kezelés világában ezt az adatfüggettenség (data independence) elvének 
nevezik. 


Kétféle adatfüggetlenségről lebet beszélni a háromrétegű modellben: a Őzikai és 
a fogalmi adatbázis között értelmezhető fizikai adatfüggettenségről, ill. a fogalmi 
adatbázis és a nézetek között értelmezhető fogíkat adatfüggettenségről. 


A fizikat adatfüggetlenségen (physical data independence) (kb. eszközfüggetlen. 
ségen) szt értjük, hogy a fizikai szinten, a fizikai működés sémájban véghezvitt 
változások nem érintik a fogalmi (logikai) adatbázist. Ha ez teljesül (gyakorlatilag 
mindig), akkor a fizikai adathordozó egy teljesen eltérő fizikai paraméterekkel ren- 
delkezőre is kicserélhető (pl. meghibásodás, technikai fejlődés stb, miatt), vagy az 
állományszervezés módja megváltoztatható anélkül, hogy az adatbázisban bármi- 
lyen logikai változás érzékelhető lenne (a rendszer teljesítőképessége, válaszidejei 
azonban jelentősen változhatnak). 


Logikai adatfüggetlenségről (Jogical data independence) akkor beszélünk, ha a lo- 
gikai adatbázis megváltozása nem jár az egyes felhasználásokhoz-felhasználókhoz 
tartozó nézetek megváltozásával. Ez az elvárás már nem teljesül minden esetben. 


Ilusztrációképpen bemutatjuk a 2.2. ábrán az adatbázis-kezelőnek és környezeté- 
nek egy tipikus, hétrétegű modelljét. 


2.1. A fejezet új fogalmai 


adatbázis nézet (view), modell, rétegmodell, fizikai adatbázis, logikai (fogalmi) 
adatbázis, külső séma, logikai adatfüggetlenség, fizikai adatfüggetlenség 
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működtető parancsok réteg 




















Adatbázis alkalmazás 7. 
halmazorfentált 
interfész 
Fordítás, optimalizálás 6. 
rekordorientált 
interfész 
Logikal keresés 5. 
belső rekord- 
interfész 
Rekord menedzsment 4. 
laporlentált 
buffer-interfész 
Buffer kezelés s B 
DBMS 
biokkorlentált 
fájl-Interfész . 
OS 
Háttértár kezelés A 
háttértár- 
interfész 
§ 


2.2. ábra. Adatbázis-kezelő (és környezete) statikus 7 rétegű modollje 
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3. fejezet 


A fizikai adatbázis 


A 2.1. ábrának megfelelően most az adatbázis-kezelő rendszerünk legalsó szintjét 
vizsgáljuk meg: hogyan lehet az adatrekordjainkat célszerűen tárolni a háttértá- 
rolán annak érdekében, hogy egy kercsett rekordot vagy rekordok egy hnlmazát 
minél gyorsabban el lehessen érni, Ennek megvalósításához az ndott tárolócszköz 
ismerete is szükséges. Jelen fejezetben a mágneslemezés háttértáron való hatékony 
tárolás lehetőségeit vizsgáljuk meg (diszkrezidens adatbázis, DRDB). Mindez ter- 
mészetesen nem jelenti azt, hogy a diszkek szerepe kizárólagos. Különösen érdekes 
— és jelentősen eltérő — az olyan adatbázis-kezelők felépítése és működése, ahol a 
teljes adatbázist memnóriában tárolják (memóriarczídens adatbázis, IMDDB). Ilye- 
nek kb. 2005 óin már kereskedelmi forgalomban is kaphatók. 


A mi, diszkekre vonatkozó megállapításaink is csupán számos egyszerűsítő feltétel 
fennállása esetén igazak. Ezeket foglaljuk össze először. 


Négy műveletet tervezünk támogatni, melyek a 


— keresés, 

- beszúrás, 

- törlés és a 
- módosítás, 


A számítógépen futó operációs rendszer az adatbázis adatait ís állományokban 
(fájlokban) tárolja. Az állományok azonos méretű blokkokból épülnek fel, a blokk- 
méret általában 0,5...32 kilobájt. Az operációs rendszer tartja nyilván, hogy egy 
állományhoz mely blokkok tartoznak. Minden blokknak abszolút címe (is) van, 
egyetlen fejmozgatással és be-/kímeneti (input/output, I/O) művelettel a blokk 
elérhető, adatai az operatív tárba (memory) juttathatók. A szükséges adatokat 
minden esetben a mágneslemezről kell beolvasni, mert nincs lehetőségünk arra, 
hagy egyidőben több blokkot a számítógép memóriájában tároljuk (ez a gyakor- 
latban természetesen általában nem igaz, azonban a következőkben alkalmazzuk 
ezt az egyszerűsítő feltételezést, hiszen DRDB esetén az adatok kis hányadát té- 
telezhetjük fel az operatív tárban elérhetőnek). 
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Cél: a fent felsorolt négy művelet minél gyorsabb elvégzése. 


Mivel a lemezműveletek időigénye (A ms) több nagyságrenddel nagyobb nhhoz ké- 
pest, mintha az adatokat a memóriában kellene megkercsni ugyanilyen szervezés 
mellett (A 45), ezért a fenti műveletek időigényét alapvetően az fogja meghatá- 
rozni, hogy egy biokk tartalmáért hányszor kell a háttértárhoz fordulni. Ezért a 
fizikai adatszervezés célját DRDB csetén úgy is étfogalmozhatjuk, hogy úgy kell 
az adatainkat a mágneslemezen tárolni, hogy a kért adat a lehető legkevesebb 
biokkművelettel legyen elérhető. A blokkművelet egyaránt jelentheti egy blokk 
írását vagy olvasását. 


A blokkok tartalmazzák az adatrekordokat, általános struktúrájuk a 3.1. Ábrán 
látható. 





polnterek, maradék hely 
foglaltészabad bítek 
stb. 


3.1. ábra. Egy blokk szerkezete 


Lényeges, hogy n rekordok öfokkhatárt nem tépnek át, így a blokkok általában 
nincsenek teljesen kihasználva. (A továbbiakban ezért feltételezzük, hogy a blokk- 
méret mindig legalább akkora, mint egyetlen rekord mérete.) 


A rekordok általános szerkezete a 3.2. ábrán látható. 





törölt bit stb. 


3.2. ébra. Egy adatrekord szerkezete 


A rekordok között megkülönböztethetünk kötött és szabad rekordokat. Egy rekord 
kötött, ha mutató (pointer) mutat rá. Ekkor a rekordot a helyéről nem mozgat- 
hatjuk el anélkül, hogy a rá mutató pointert meg ne változtatnánk. Szatadnak 
nevezzük a rekordot, ha nem mutat rá mutató. A szabad rekordok segíthetnek a 
háttértár hatékonyabb kihasználásában. 


A rekordokat számos módon megcímezhetjük. A legegyszerűbb esetben minden 
rekordnak lehet egy abszolút fizikai címe. Gyakoribb ennél, hogy megadjuk annak 
a blokknak a fizikai címét, amely a rekordot tartalmazza, plusz egy olszetet, nmely 
a blokkon belüli kezdőcímet adja meg. Ezen kívül fogikaílag is megcímezkető egy 
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rekord, pl. ha megadjuk egy kulcsának az értékét, hiszen az is alkalmas lehet a 
rekord egyértelmű azonosítására. 


Másrészről, a rekordok lehetnek rögzített vagy változó formátumúak / hosszúságú- 
ak is. Változó lehet a formátumuk, ha pl. változó hosszúságú mezőt vagy ismétlődő 
csoportot (tipikus a hálós adatbázíisoknál, ld. 7. fejezet) tartalmaznak. A változó 
hosszúságú rekordok problémájával csak a 3.4. szakaszban foglalkozunk. 


A továbbiakban tehát feltételezzük, hogy az adatállományok minden rekordjában a 
mezők ugyanabban a sorrendben fordulnak elő, és a hosszuk ís minden rekordban 
azonos. 


Tárolnunk kelt valahol! a különböző típusú rekordokkal kapcsolatban azt az in- 
formációt is, hogy milyen a felépítésük, az egyes mezőket hogyan kell értelmezni 
(egész szám, lebegőpontos, karakterlánc, stb.). Így ha a blokk fejléc (fejrész) után 
a rekordok közvetlenül egymás után következnek, egyértelműen tudjuk dekódolni 
a mezőket, Ekkor már csak arról kell gondoskodni, hogyan különböztessük meg 
az ,élő" rekordokat a még soha nem használt üres helyektől. Egy lehetőség, ha 
a blokk headerben egy számláló jelzi a blokkon belüli élő rekordok mindenkori 
számát, de más megoldások ís elképzelhetők. 


A továbbiakban a hasznos - a fejrész méretét nem tartalmazó - blokkméretet 
6-vel, az r állomány rekordméretét sp-rel, rekordjainak számát np-rel jelöljük. 
Az r állományban egy blokkban elhelyezhető rekordok számát biocking factornak 
nevezzük és f,-rel jelöljük: 
.]b 
féle: 


Az állomány által elfoglalt blokkok számát b;-rel jelöljük:? 


veli 


A továbbiakban három fizikai szervezési módot vizsgálunk meg részletesen: a hcap, 
4 hash és az indexelt szervezést. 


3.1. Heap szervezés (heap file organization) 


Ebben az esetben közelítjük meg legegyszerűbben a tárolás problémáját (heap: 
halom, kupac). Az adatokat (legalább) annyi blokkban tároljuk, amennyit a re- 
kordok száma és mérete megkövetel/igényel, de nem rendelünk hozzá semmilyen 
kiegészítöfsegéd-struktúrát. 


! Erre a célra az adatbázisnak egy kitüntetett területét szokás használni, amit a különböző 


kereskedelmi adatbázis-kezelő rendszerek különböző nevekkel illetaek (ld. data dictionary, 
data repository, -)- 
2 A valóságban ennél több blokkra is szükség lehet, ha töredezett az áltomány. 
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Kercsés 


Mivel a már megismert struktúrákon kívül (blokk, rekord, mező) újat nem hozunk 
létre, így a tárolásban nincs egyéb szabályosság. Ha valamely érték (— keresési 
kulcs) alapján egyetlen rekordot tudunk azonosítani, akkor egymás után beolvas- 
suk a háttértárról a memóriába a kérdéses rekordokat tartalmazó állomány blokk. 
jait, majd végigolvassuk a blokkokat mindoddig, amíg rá nem találunk a kercsettre 
(lineáris keresés). Szerencsés esetben csak egyetlen blokkot, szerencsétlen esetben 
az állomány minden btokkját végig kell olvasnunk. Így egy egyedi külcsérték által 
meghatározott egyetlen rekord megtalálásához átlagosan (blokkok száma 4 1)/2 
" számú blokkműveletet kell elvégezni. 


Törlés 


A törlendő - t. f. h. egyetlen — rekordot megkeressük, ennek időigénye már ismert, 
A rekord fejlécben jelezzük, hogy a terület (— sutblock) felszabadult, tehát ha 
a rekord nem kötött, akkor a terület felülírható, ezután a megváltozott blokkot 
még vissza kell írni a diszkre a megtalálása után. Időnként szükség lelet a gyakori 
törlések következtében szétszóródott lemezterületek összegyűjtésére és egyesítésé- 
re. Az ún. szemétgyűjtő (garbage colleetor) programmodul a törölt jelzés alapján 
tudja, hogy ezt a területet felül lehet írni. 


Boszúrás 


Beszúrásnál ügyelni kell arra, hogy a rekordok egyediséget biztosító mezőinek 
értékei valóban egyediek maradjanak a beszúrás után ís, Először an törlés által 
felszabadított területeken próbálkozunk. Ia itt nem találunk helyet, akkor az ál- 
lomány végén próbálkozunk. Han ítt sincs elég szabad terület, akkor az operációs 
rendszert, ill. az adatbázis adminisztrátort keil megkérni, hogy bővítse az állo- 
mányt. Ennek végrehajtása komplex feladat lehet, ugyanis célszerű cgy fizikailag 
egybefüggő (kevés fejmozgatással elérhető) diszkterülettel bővíteni az adatbázist. 


Módosítás 


A módosítás egyszerű művelet, ha az egyediséget biztosító mező(k) értéke nem vál- 
tözik. Ekkor a módosítás egy rekord megkeresését, felülírását, majd a tartalmazó 
blokk háttértárra való visszaírását jelenti. Minden egyéb esetben gondoskodni kell 
arról, hogy két megkülönböztethetetlen rekord ne kerüljön az adatbázisba, 


3.2. Hash-állományok 
A hash-címzés vagy csönkolásos címzés onnan kapta nevét, hogy elvileg a kercsés 


kulcsának bitmintájából csonkolással ís nyerhető egy cím, amely alapján a kercsett 
rekord megtalálható. 
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A hashelés legegyszerűbb változatában minden rekordhoz egy egyértelmű címet 
rendelünk az ún. hash-függvény segítségével. A hash-függvény a rekord IC (kere- 
sési) kulcsát egyértelműen képezi le egy intervallumra. Az intervallum legalább 
akkora, mint a szóba jöhető rekordok maximális száma. Így a rekord kulcsának 
ismeretében egy egyszerű számítássat megkaphatjuk a rekord tárolási helyét, te- 
hát egyetlen biokkmüvekttel elérhetjük a rekordot az általában hosszadalmas, 
blokkok közötti keresés? helyett. 


Ez a megközelítés - bár igen gyors rekordhozzáférést tesz lehetővé - ebben a for- 
májában gyakorlatban alig használható, mert a háttértárat igen rosszul használná 
ki. 


Egy gyakorlati megoldást az ún. vódrös hashelés (bucket hashing) jelent, melynek 
alapgondolata és fogalmai a 3.3. ábrán láthatók. 


Osszuk fel az adatállományt B (vödör, bucket) részre úgy, hogy minden rész leg- 
alább egy blokkból álljon! Hozzunk létre egy 8 számú mutatóból álló ún. vödör- 
katalógust (hash table, bucket dírectory), amelyben minden mutató az állomány 
egy-egy blokkcsoportjának (vödörnek) a címét tartalmazza. Dcfiniáljunk továbbá 
egy A hash-függvényt (hash function), amely a kulcsok szóbajöhető értékkészle- 
tét leképezi a (0, B — 1] tartományra mégpedig lehetőleg egyenletesen, ha a kulcs 
befutja a szóba jöhető értékeinek tartományát. 


A vödrös hash-szervezés lényege az, hogy azt a rekordot, amelyiknek a kulcsa K 
értékű, mindig a k(K)-adik vödörben kell tárolni. A tárolás hatékonysága nagy- 
mértékben a hash-függyény megalkotásán múlik, másrészt azon, hogy az adatál- 
lomány nagysága jól becsülhető, ill. közel állandó-e. 


Égy gyakran használt hash-függvény a h(K) — (c- I) mod B, ahot c egy alkal- 
mnsan megválasztott állandó. 


er d vödör 0 
vödör 1 
vödör 2 


vödör B-1 





5 
vödös katalógus adatállomány 


3.3. ábra. Vödrös hash-szervezés 


5 Ld. heap (3.1. szakasz) ill. indexelt szervezés (3.3. szakasz). 
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Keresés 


1. Meghatározzuk a rekord kulcsát: X (t. f. h. ez a rekord számárn egyediséget 
biztosít). 

2. Kiszámítjuk hí(J4X)-t. 

3. Kiolvassuk a vödör katalógus A(KX)-adik bejegyzését, ezen a címen kezdödö 
vödörben kell a rekordnak lennie, ha egyáltalán benne van. 


Végigolvassuk a vödör első blokkjának mindegyik nem törölt és nem üres rekordhe- 
lyét. Ha valamely kiolvasott rekordnak K a kulcsa, akkor megtaláltuk a rekordot. 
Ha nem, akkor a vödör következő, ún. túlcsordulási blokkjait vizsgáljuk végig ha- 
sonló módon. (Ezt a blokkot a blokk headerben lévő mutató címzi.) Ha a vödör 
egyik blokkjában sem találtuk meg a K kulcsú rekordot, nkkor az biztosan nincs 
az adatbázisban. 


Vegyük észre, hogy egy vödrön belül lényegében lineáris keresést végeztünk. 
Ugyanakkor nem kellett a teljes adatállományt végignézni hanem csak egy megha- 
tározott vödörhöz tartozó blokkokat, átlagosan - ha a kereséseinkre van találat - 
az állomány 1/(28B)-ed részét, amennyiben a vödrök egyforma hosszúak. 


Beszúrás 


Helyezzük el az állományban a I kulcsú rekordot! Beszúrásnál természetesen ítt 
is ügyelni kcil arra, hogy a rekordok egyediséget biztosító mezőinek értékei való- 
ban egyediek maradjanak a beszúrás után ís. Ehhez kiszámítjuk 4( IX) értékét, és 
kiolvassuk a vödör katalógus h(/6)-adik bejegyzését. Először végigkeressük az Így 
meghatározott vödrőt a /( kulcsú rekord után. Ha megtaláljuk, akkor híbaüzene- 
tet küldünk, hogy a kulcs egyediségének megsértése elkerülhető legyen. In nem 
találjuk a FC kulcsú rekordot, akkor az első szabad vagy törölt helyre beírjuk a 
rekordot, miközben megfelelően beállítjuk a ,törölt" bítet. Ia mintden hely fog- 
lalt, akkor a vödörhöz egy új blokkot kell hozzáfűzni, és nz új rekordot itt kell 
elhelyezni, 


Törlés 

Megkeressük a kívánt rekordot a már jól ismert módon. A törölt bitet bebillentjük, 
a módosított blokkot visszaírjuk a díiszkre. 

Módosítás 


Ha a módosítás nem érint kuülesmezőt, akkor egyszerűen végrehajtható: megke- 
ressük a módosítandó rekordot tartalmazó blokkot, és a művelet elvégzése után a 
blokkot visszaírjuk a háttértárra. Ha nem találtuk a rekordot, akkor hibaüzenetet 
küldünk. 


Ha a módosítás kulcsmezőt is érint, akkor a módosítás egy törlés és egy beszúrás 
egymás utáni végrehajtására, vezet, mivel a módosított rekord feltehetően egy 
másik vödörbe fog kerülni. 
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Jól érzékelhető, hogy a hash-alapú műveletek igen gyorsak lehetnek, ha a vöd- 
rök hossza kicsi. Szélsőséges esetben, ha minden vödör csak egyetlen blokkból áll, 
akkor az összes rekord egyetlen blokkhozzáféréssel elérhető, feltéve, hogy a vödör 
katológus elég kicsi ahhoz, hogy a memóriában lehessen tárolni (ezt általában 
feltételezzük). Ennek ára az, hogy a háttértár valószínűleg nincs jót kihasználva. 
Ellenkezőleg, ha a vödrök szárna kícsi és emiatt a vödrök hosszúak, akkor a háttér. 
tár kihasználtsága javul, azonban a. vödrökön belüli lineáris keresés miatt az egy 
rekord megtalálásához szükséges blokkélérések száma nő. Tekintettel arra, hogy 
manapság a diszkterület az egyik legolcsóbb erőforrás, nem a diszkterülettel való 
takarékosságra érdemes törekedni, ha a keresést gyorsítani kel. 


A hash-áltományszervezés másik jellegzetessége, hogy az ún. tól-ig" kereséseket 
(intervallumkeresés) nem támogatja (ilyenkor mindazon rekordokat keressük az 
adatbázisban, amelyeknek kulcsa egy adott intervallumba esik). Ha ilyen feladat 
gyakran adódik, akkor valamilyen indexelt megoldás alkalmazása célszerű. 


3.3. Indexelt állományok 


Ha egy könyvtárban egy könyvet keresünk, nem nézzük végig a könyvtár raktárát 
és olvassuk végig valamennyi könyvcímet és/vagy szerzőt. Helyette n könyvtári 
katalógust (— egy segédstruktúrát) lapozgatjuk, amelynek mérete töredéke a tel- 
jes könyvállományénak, így könnyebben kezelhető (katalóguscédulák, mikrofilm), 
ráadásul ábécébe rendezett, szemben a könyvraktárral. Továbbá, a különböző ka- 
talógusok többféle szempont szerint is lehetnek rendezve: akár tétnakör, máskor 
könyveim vagy szerző szerint. A keresés is lényegesen gyorsabb benne, hiszen a 
rendezettsége miatt a lincárisnál hatékonyabb kercsési algorítmusokat alkalmazha- 
tunk, A megtalált katalóguscédula azután megmutatja, hogy a raktárban melyik 
polcról lehet a kercsett művet leemelni, 


Ugyanez az indezelt szervezés alapgondolata is: a kercsés kulcsát egy ún. in- 
doxAlhományban (kb. katalógus) megismételjük, és a kulcshoz egy mutatót ren. 
delünk, amely a tárolt adatrekord helyére mutat. Az indexelt állományszervezés 
alapstruktúráját és fontosabb fogalmait a 3.4. ábra mutatja. 


A kulcsot és a mutatót is rögzített hosszúsággal ábrázoljuk (hosszukat rendre 
k és p jelöli, több kulcs esetén: 4y,£2)...). Az indexállomány blocking factora 
$z les] ahol i az indexállomány neve. 


Az indezállományt mindig rendezve tartjuk. Ha a kulcs numerikus, akkor a rende- 
zés triviális. Ha szöveges, akkor lexikografikus rendezést alkalmazbatunk. Össze- 
tett kulcs (composite key) esetén, vagyis amikor a kulcs több mezőből áll, defi- 
niálnunk kell a rendezés módját, azt, hogy a kulcsmezők mely sorrendje alapján 
történjen a rendezés. Ennek a sorrendnek az alkalmas megválasztása jelentősen 
befolyásolhatja az index használatának a hatékonyságát. Általában nincs aka- 
dálya, hogy több indexállományt is létrehozzunk ugyanazon adatállományhoz, 
különböző (vagy különbözően rendezett) kulcsmezőkkel, bár vannak nehézségek 
(Id. 3.3.4, alszakasz). Még az sem biztos, hogy ez a mező (Al. ezek a mezők) egy 
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rekordot egyértelműen azonosítnnak. Ebben a kontextusban tehát fkeresési) kutcs 
tesz minden, ami szerint egy indexet felépítünk, itt. a keresést végezrűk. Vegyük 
észre, hogy az indexállomány (azonos hosszúságú) rekordjai szabadok, Így könnyen 
mozgathatók, jól karbantarthatók. Ugyanakkor az adatállomány rekordjai valn- 
milyen értelemben kötöttekké válnak, 


Index állomány adat (fő) állomány 





ME 
kulcsértékek mutatók 


3.4. ábra. Indexelt szervezés 


Mindeddig nem volt szó arról, hogy az indexrekordokat hogyan feleltetjük meg az 
indexelt állomány rekordjainak. Két alapvetően különböző megoldás lehetséges: 


1. indexrekordot rendelünk minden egyes adatrekordhoz, vagy 


2. indexrekordot rendelünk adatrekordok egy csoportjához, tipikusan az egy 
blokkban levőkhöz. 


Az első csetben sűrű inderről, n másodikban ritka inderről beszélünk. 


3.3.1. Ritka indexek (sparse indices) 


A ritka indexelésnek megfelelő hétköznapi példa a szótárak lapjainnk felső sarká- 
ba írott index, amely csak azt azonosítja, hogy a kercsett címszó n szótár melyik 
oldalán található. Az adatbázis-kezelésben használatos ritka indexelés esetén az 
indexrekordok azt határozzák meg, hogy az adatállomány rekordjai melyik blokk- 
ban találhatók. Ennek következtében egy biokkon detüt az adatrckordok szabad 
rekordoknak tekinthetők. Ritka indexek csetén az adatállományt is rendezetten 
kelt tárolni, legalábbis abban az értelemben, hogy égy blokkban kell, hogy legyen 
minden olyan adatrekord, amelyeknek a kulcsa egy meghatározott intervallumba 
esik. Az adott blokkra mutató indexrekord a blokk címét, valamint a legkisebb 
(vagy a legnagyobb) értékű kulcsot fogja tartalmazni, 


Az rt ritka indexállomány blokkjainak száma brj — [gi , ahol az előzőekkel 
összhangban ng — br, ha az r állományhoz épített ritka indexről beszélünk. 
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Keresés 


Tételezzük fel, hogy a Az kulcsú rekordra van szükségünk. Az indexállományban 
megkeressük azt a rekordot, amelyiknek 42 kulcsa a legnagyobb azok közül, ame- 
lyek még kisebbek £)y-nél (vagy éppen egyenlő vele). A keresés lehet pl. bináris, 
hiszen az indexállomány kulcs szerint rendezett. A ka kulcsú indexrekord muta- 
tója megcímzi azt a blokkot, amelyet végig kell kercsni a 44 kulcsú adatrekord 
után. A blokkon belüli kercsés lehet lineáris is, annak időigénye még mindig jóval . 
kisebb a blokk beolvasásának idejénél. De használhatunk bináris kercsést itt is, 
ha a blokkon belül is rendezetten tároljuk az adatrekordokat - ami azonban nem 
szükségszerű. 


Index állomány adat (tó) állomány 


blokk3 


blokka4 


blokkS 


blokk6 


blokk? 


bliokk§ 





3.5. ábra. Ritka index szervezés 


Boszúrás 


Tételezzük fel, hogy a kz kulcsú rekordot akarjuk tárolni. Ehhez először megkeres- 
sük azt a blokkot, amelyben a rekordnak lennie kellene, ha az adatáltományban 
lenne. Legyen ez a B; blokk. Ezután két cset lehetséges: vagy van elegendő hely 
a B; blokkban a Xi kulcsú rekord számára vagy nincs. Ha van, akkor a rekordot 
beírjuk a B; blokkba., Ha nincs, akkor helyet kell számára csinálni. Egy lehető- 
ség, hogy kérünk egy új, üres blokkot (Ba), majd a 8; blokk rekordjainak számát 
(beleértve a 44 kulcsút is) megfelezzük B; és Bn között (természetesen a rendezett- 
séget megőrizve). Meghatározzuk mindkét blokkban a legkisebb kulcsú rekordot. 
A B;-hez tartozó indexrekordban szükség esetén korrigáljuk a kulcsmező értékét. 
A Bn-hez tartozó legkisebb kulccsal és Bn címével új indexrekordot képezünk, 
amelyet a megfelelő pozícióban elhelyezünk az indexállományban. Ehhez esetleg 
az indexállományt is újra kell rendezni. 


Törlés 


Tételezzük fel, hogy a 44 kulcsú rekordot kívánjuk törölni. Ehhez először megke- 
ressük azt a blokkot, amelyik a rekordot tartalmazza, legyen ez 8;. Ha a ks kulcs 
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a blokkban nem a legkisebb, akkor a rekordot egyszerűen töröljük, a keletkező 
lyukat akár rögtön meg is szüntethetjük a rekordok blokkon belüli mozgatásávnl. 
Ha Ap volt a legkisebb kulcs a blokkban, akkor az indexállományt is korrigálni kell 
B; új, legkisebb kulcsának megfelelően. 


Ha a B; blokkban a £i kulcsú volt az egyetlen rekord, akkor n 8;-re mutató 
indexrekordot is törölni kell, az üres adatblokkot pedig fel kell szabadítnni. 


Módosítás 


A módosítás egyszerű, ha nem érint kulcsot. Ekkor meg kell keresni na szóban 
forgó rekordot, elvégezni a módosítást, majd az érintett adatblokkot visszaírni a 
háttértárra, 


Ha na módosítás kulcsmezőt is érint, akkor egy törlést követő beszúrás valósíthatjn 
meg egy rekord módosítását. 


3.3.2. Btr-fák, mint többszíntes ritka indexek 


Az indexelt szervezésnél loga b-vel (d; az f indexállomány blokkjninak száma) ará- 
nyos átlagos keresési idő érhető el, amcly lényegesen kisebb, mint a heap szervezé- 
sé (b,-rel arányos), de elmarad a hasheszervezésé (melynek keresési blokkművelet- 
igénye akár konstans 1 is lehet) mögött. Cserébe an háttértár kihasználtsága változó 
méretű adatállomány esetén is kézben tartható. 


A szervezés bonyolítása árán lehetőség van a blokkelérések számát csökkenteni úgy, 
hogy logz b.-vel arányos kercsési időt érjünk el. Igen nagy méretű adatállományok 
csetén, ill., ha k elég nagy, akkor jelentös az elérhető nyercség, Ennek ára, hogy az 
indexeket egy k-ágú fában kell tárolnunk és az ndatállomány változása során az 
indexfát is gondosan karban kell tartanunk. Az ezzel járó többletadminisztráció 
és az indexállomány valnmelyest megnövekedett mérete áll szemben a gyorsabb 
blokkeléréssel. 


Az alapgondolat az, hogy az indexállományban való keresést meggyorsíthatjuk, 
la az indexállományhoz ís (ritka) indexet készítünk hasonló szabályok szerint. Az 
eljárás mindaddig folytatható, ameddig az utolsó index egyetlen blokkba be nem 
fér. Az £— 1. index tehát egyidejűleg ritka indexe oz f. indexnek és nadatállománya 
az í — 2. indexnek. A legalsó szint mutntói az ndatállomány egy-egy bilokkjára 
mutatnak, a fölötte levő szintek mutatói pedig az indexállomány egy-egy részfáját 
azonosítják (ld. 3.6. ábra). 
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Index-szánt 
1-2. 





adat- 
állomány 


3.6. ábra. Fa szervezésű indexelés 


A fa szervezésű indexeknek számtalan változata képzelhető e. Itt a továbbiakban 
arról a változatról lesz csupán szó, amelynek minden levele és csomópontja pon- 
tosan blokkméretű és a gyökértől a levelekíg vezető út mindig ugyanolyan hosszú, 
tehát a Ín kiegyenlített (,balanced"). Szokásos még, hogy az egy csomópontban 
ábrázolt ( mutatóhoz csak f( — 1 kulcsot tárolnak, mert a kulcs jelentése a kijelölt 
részfában tárolt legkisebb kulcsérték. Így az indexblokkok első kulcsérték bejegy- 
zése nem hordozna információt. Áz ilyen indexelést nevezik Bt-fa (, bé-csillag fa") 
indexeknek, Bt-fa escién a blocking factor, azaz a fa elágazási tényezője: 


abol XA a kulcs hosszát jelöli. Az r állományhoz tartozó B"t-fa szintjeinek számát 
IT4-vel (Height ol Tree) jelöljük (ld. még a 6.2.2. alsznkaszt): 


ar; z [1084 be] 


A gyakorlati megvalósításokban a leveleket gyakran egyik vagy mindkét írányban 
összeláncolják, amivel ez intervallumkereséseket lehet gyorsítani. 


Keresés 


Az eljárás hasonló ahhoz, mint amit az egyszintű ritka indexek esetén kellett 
végrehajtani, csupán az indexállományban több lépésben végezzük a keresést. 


Tételezzük fel, hogy a vi kulcsú rekordra van szükségünk. Az indexállomány csú- 
csán álló blokkban megkeressük azt a rekordot, amelyiknek v2 kulcsa a legnagyobb 
azok közül, amelyek még kisebbek vi-nél (vagy egyenlő vele). Ennek a rekordnak 
a mutatója az eggyel alacsonyabb szintű indexben rámutat arra a blokkra, amely- 
ben a keresést tovább kell folytatni egy olyan indexrekord után, amelyiknek v3 
kulcsa a legnagyobb azok közül, amelyek még kisebbek v1-nél (vagy egyenlő vele). 
Az eljárás mindaddig folytatandó, ameddig az utolsó mutató már az adatállomány 
egy olyan blokkját azonosítja, amelyben a vy kulcsú rekordnak lennie kell. 
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Beszúrás 


Az eljárás nagymértékben hnsonló n 3.3.1. szakaszban n beszúrásnál leírtakhoz. 
Jelentős különbség csak az indexállomány karbantartásában van, amikor ís gon- 
dosan ügyelni kell arra, hogy az eredeti fastruktúrát, annak kiegyenlítettségét 
fenntartsuk. Ez bizonyos esetekben az indexhicrarchia minden szintjén igényel- 
heti néhány blokk megváltoztatását. A követendő eljárást a 3.7. és a 3.8. ábrák 
szemléltetik, Az ábrákon üzt az egyszerűsítő feltételezést tettük, hogy az ndnt- 
rekordoknak csupán egyetlen mezőjük van, ami egyben nyilván kulcsmezőül is 
szolgál. 





3.8. ábra, A B"-fa a 32 kulcsú rekord beszúrása után 


Törlés 


Megkeressük a kívánt adatot és töröljük, Az adatblokkokat lehetőség szerint össze- 
vonjuk. Összevonáskor, vagy ha egy adatblokk utolsó rekordját ís töröltük, a meg- 
szűnt blokkhoz tartozó kulcsot is ki kell venni az indexállomány érintett rész- 
fájából. Ehhez adott esetben a fa minden szintjén szükség lehet néhány blokk 
módosítására, 


Módosítás 


Elvben azonos a 3.3.1. pontban leírtakkal, a bonyolultabb indexstruktúrából adó- 
dó követelményeket értelemszerűen alkalmazva. 


3.3.3. Sűrű indexek (dense indiccs) 


A ritka index szervezésnél kihasználtuk azt, hogy egy rekord eléréséhez - a hát- 
tértároló fizikai működéséből adódó okok miatt — mindíg egy teljes blokkot kell 
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a memóriába beolvasnunk. A blokkon belüli keresés már igen gyors, így elegendő 
az indexállományban a blokkcímeket tárolni a bennük található legkisebb kulcs- 
értékkel együtt. Ennek az ára viszont az, hogy az adatállományt ís rendezetten 
kell tárolni, hacsak nem megengedhető az ,egy adatblokk — egy adatrekord" tá- 
rolási sűrűség. Másrészről, az ndatállormány rendezettsége miatt nincs mód arra, 
hogy egy-egy új rekordot tetszőleges szabad helyre szúrjunk be, ami a háttértár 
kihasználtságát csökkenti. 


Mindkét problémára megoldást kínál, ha minden egyes adatrekordhoz tartozik in- 
dexrekord. Az indexrekord mutatója általában továbbra is csak a rekordot tartal- 
mazó blokkot azonosítja, néha közvetlenül az adatrekordot. Ez utóbbi megoldással . 
a blokkelérések számát természetesen nem lehet csökkenteni, legfeljebb a blokkon 
belüli keresés idejét. 


Megjegyzés. A ,sűrű indexelés" önmagában nem állományszervezési módszer! 
A sürű indexre mindig ráépül egy másik elérési mechanizmus is, ritka index vagy 


hash, A sűrű indexek elsősorban a lő állomány kezelését könnyítik meg, ill. több 
kulcs szerinti keresést teszik lehetővé (Id. 3.3.4. alszakasz). 





Az si sűrű indexállomány blokkjainak száma baz; — Ti , ahol az előzőekkel össz- 
hangban nyes ny, ha az r állományhoz épített sűrű indexről beszélünk. 


A sürü indexek tipikus alkalmazása a 3.9. ábrán látható. 


hash vagy ritka index 





adatállomány 


3.9. ábra. Sűrű index alkalmazása 


A bemutatott megoldásnak a hátrányain kívül számos előnye is van. 
Hátrányok: 

- a sűrű indexnek plusz helyigénye van, 

a eggyel több indirekció kell egy rekord kiolvasásához, 

- plusz adminisztrációval jár a sűrű index karbantartása. 
Viszont: 


— az adatállományt nem kell rendezetten tárolni, így helyet takaríthatunk meg, 
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- meggyorsíthotja a rekördelérést, snert na ritka index mérete jóval kisebb ís 
lehet, mint sűrű index nélkül, 

- támogatja a több kulcs szerinti keresést, 

- az adatállomány rckordjai (csaknem) szabadokká tehetők, hn minden töváb- 
bi rekordhivatkozás a sűrű indexen keresztül történik (egyetlen inutatót kell 
megváltoztatni). 


Kercsés 


Az indexállományban megkeressük a kulcsot, pl. bináris kereséssel. A hozzá tar- 
tozó mutatóval elérhetjük a tárolt rekordot. 


Törlés 


Megkeressük a kívánt rekordot. A hozzátartozó törölt bitet szabadra állítjuk. A 
kulcsot kivesszük az indexállományból, és az indexállományt időnként - művelet- 
igényessége miatt nem minden törlés után - tömörítjük, 


Beszúrás 


Keresünk egy üres helyet a tárolandó rekordnak. Ha nem találunk, akkor az ál- 
lomány végére vesszük fel. Beállítjuk n foglaltsági jelzést és beírjuk az adatot. 
A kulcsot és a tárolás helyére hivatkozó mutatót a kulcs szerint berendezzük az 
indexállományba. 


Módosítás 


Sűrű indexelés esetén a módosítás viszonylag egyszerű: megkeressük a módosítan- 
dó rekordot tartalmazó adatblokkot, majd a módosított tartalommal visszaírjuk 
a háttértárra. Ila a módosítás kulcsmezőt is érintett, akkor az iudexállományt 
újrarendezzük. 


3.3.4. Invertálás 


Erősen korlátozott a használhatósága annak az adatbázisnak, amely pl. szemé- 
lyek adatait tartalmazza, de benne megtalálni valakinek az ndatnit csak nkkor 
lehet, ha pontosan ismerjük az illető személyi számát. (Azért kellene a személyi 
számot ismerni, mert - mint mindenkit egyértelműen azonosító adatot -— kercsési 
kulcsnak tekintettük és ezért a személyi szátn szerinti kercsést támogattuk vala- 
milyen állományszervezési módszerrel.) Gyakori az az igény, hogy csupán a név 
alapján ís kereshessünk, vagy listát készíthessünk mindazokról, akik egy ndott vá- 
tosban laknak. A név és a lakóhely nem kulesmezők. Általában több mező szerint 
is támogatni kell az adatrekordok megtalálását. Gyakran ilyenkor is kulcsról be- 
szélnek azzal a mezővel kapcsolatban, amely szerint a keresés történik, Mivel a 
kulcs fogalma az adatbázisok logikai tervezése kapcsán ís előkerül, a félreértéseket 
elkerülendő, célszerű hangsúlyozni, ha csak a fizikai keresés során tekintünk egy 
mezőt kulcsnak. Szélsőséges esetben akár minden mező lehet ún. kercsési kulcs. 
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Az cddig tárgyalt módszerek különböző mértékben támogatják a fenti problé- 
ma megoldását. Itt csak annak néhány részletére térünk ki, ha az indexszervezés 
módosításával-kibővítésével támogatjuk a tőbb kulcs szerinti kercsést. 


Az egyik kézenfekvő lehetőség, hogy több indexállományt is létrehozunk, minden 
keresési kulcshoz egyet. 





Definíció — invertált állomány finverted file). Azt az indexállományt, amely 
nem kulcsmezőre" tartalmaz indexeket, invertált éllománynak nevezzük. 


§ azaz egyediséget nem biztosító mezőre 


Az invertált állomány mutatói 


1. lehetnek fizikai mutatók, amelyek pl. mutathatnak 
a) közvetlenül az adatállomány megfelelő blokkjára (esetleg közvetlenül a 
rekordra), vagy 
b) az adatállomány elsődleges kulcsa szerinti (sűrű) indexállomány meg- 
felelő rekordjára, ill. 


2. lehetnek logikai mutatók, amelyek az ndatállomány valamely kulcsának ér- 
tékét tartalmazzák. 


Az 1.a) esetben az adatállomány rekordjni kötöttek és ráadásul csak egyetlen 
invertált állomány esetén használhntó. 


Az 1.6) csetben eggyel több indirekción keresztül érjük el a keresett rekordot, 
de az adatrekordok változtatásakor csak az érintett mezőt (mezőket) tartalmazó 
invertált állományokat és az indexállományt kell módosítani. 


Ha a 2. megoldást választjuk, akkor az adatállomány rekordjai szabadok lehet 
nek, viszont nem ismerjük még a keresett rekord címét. Ennek megtalálását pl. 
hasheléssel vagy valamilyen indexeléses módszerrel támogathatjuk. 


A 3.10. ábra azt mutatja be, hogyan lehet egy állományhoz az 1.b) esetben sű- 
rű index segítségével tetszőleges számú ritka indexet rendelni, a 3.11. ábra pedig 
ugyanennek a problémának a megoldását mutatja, ha az invertált állományokban 
logikai mutatót (az elsődleges kulcs értékeit) alkalmazunk a rekordok azonosítá- 
sára - ez a fenti 2. eset. 





sűrű Index 7 


3.10. ábra. Adatállomány elérése több indexen keresztül, sűrű index 






Index állomány elsődleges 
kulcs alapján 


adatállomány 


3.11. ábra. Adatállomány elérése, ha az invertált állomány logikai mutatókat tar- 
talmaz 








3.4. Változó hosszúságú rekordok kezelése 
Egy rekord változó hosszúságát okozhatja, hogy 


a) egy mező hossza változó, vagy 


b) ismétlődő mezőícsoport) van a rekordban (hálós nadatbázisoknál gyakori, 
ld. 7. fejezet). 


Általánosan elterjedt megoldás, hogy egy rekord változó hosszúságú részeit a re- 
körd mezőlistájának a végén helyezzük el. Így a rekord eleje fix hosszúságú marad. 
Az a) esetben a leggyakoribb megoldás, hogy a változó hosszúságú mező helyett 
csak egy (fix hosszóságú) mutató van a rekordban, a mező tényleges tartalma egy 
külön állományban tárolódik. Így biztosítható, bogy egy Állomány csak egyféle 
rekordot tartalmaz, ami a karbantartást jelentősen megkönnyíti. 


A b) cset kezelésére három megoldás kínálkozik: 


- lefoglalt hely módszer: ilyenkor a maximális számú ismétlődéshez elegendő 
nagyságú helyet foglalunk a rekordnak; 

- mutatós módszer: az a) módszer megfelelője; 

- kombinált módszer: valamennyi helyet lefoglalunk, ha még több az ismétlő- 
dés, akkor a mutatós módszert alkalmazzuk. 


3.5. Részleges információ alapján történő keresés 


Igen gyakori az a szituáció, amikor egy rekord több mezőjének értékét ismerjük, 
és keressük azokat a rekordokat, amelyek ugyanezeket az értékeket tartalmazzák 
ugyanezen mezőikben, Feltételezzük, hogy a mezők egyike sem kulcs. 


Egyik lehetőség, hogy több (pl. minden) mezőre építünk indexeket. Minden spc- 
cífikált mező-érték alapján előállítjuk a találati rekord- (vagy legalább mutató-) 
halmazt, majd ezeknek a metszetét képezzük. Ez nem ígazán praktikus. 
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Másik lehetőség: particionált (feldarabolt) hash-függvények alkalmazása. A R(IK) 
függyény a 3.2. szakaszban egy WV hosszúságú címet állított elő, amely egy 
(0, B — H] intervallumba eső értéket jelentett. 


Most a hash-függvény ht (rn, m2,.... mr) z hi (mi) sh2 (ma). ..rhr. (mp) alakú, 
ahol az m;,-k a rekord összesen k db, releváns mezőjének az értékeit jelentik, h; az 
1-edik mezőre alkalmnzott hash-függvény komponens, s pedig a konkatenáció jele, 
A hz(m;) függvényértékek z; hosszúságon ábrázolható értéket állítanak elő. A h; 
függvényeket tehát úgy kell megválasztani, hogy az ri tz2-t... Hz érték, azaz 
a teljes cím hossza éppen /V legyen. Az eljárás az z,-k egyéb szempontok szerinti 
megválasztásával hangolható. 


Használata: az ismert mezők értékei alapján meghatározhatjuk az N hosszúságú 
bitmintának az ismert értékű mezőkhöz tartozó darabjait, a többi nyilván tet- 
szőöleges lehet. Mindazon vödröket végig kell néznünk illeszkedő rekordok után, 
melyeknek a sorszáma illeszkedik a kapott bitmintára. 


3.6. A fejezet új fogalmai 


DRDB, IMDB, operatív tár, háttértár, elsődlegesZmásodlagos háttértár, soros 
hozzáférés, direkt /közvetlen hozzáférés, mágnesszalag, mágnesdob, mágneslemez, 
track, cilinder, szektor, fájl, blokk, blokk header, rekord, rekord header, mező, 
mutató (pointer), fizikaj/logikai címzés, (kercsési) kulcs, invertált állomány, kö- 
tött/szabad rekord, blocking factor, rekordelérési idő (min., max., átlagos), he- 
ap szervezésű állomány, fizikai segédstruktúra, hash szervezésű állomány, bucket 
hashing (vödrös hash), indexelt állományszervezés, ritka index, sűrű index, B"- 
Ín, kiegyensúlyozott fa (balanccd trce), fa magassága, elágazási tényező, elsőd- 
leges/másodlagos index, intervállumkeresés, több kulcs szerinti keresés, részleges 
információ alapján történő kercsés, particionált hash 


4. fejezet 


A fogalmi (logikai) adatbázis 


Ebben a fejezetben a 2.1. ábrán megismert adatbázis-modell középső, logikai részét 
vizsgáljuk meg részletesebben. 


4.1. Adatmodoellek, modellezés 


Amikor egy adatbázist létrehozunk, a cél az, hogy benne a való - vagy ritkábban 
egy kitalált - világ adatait tároljuk úgy, hogy belőle a való (kitalált) világról infor- 
mációkat nyorhessünk ahelyett, hogy a valóságból kelljen ugyannzt az információt 
megszerezni. Általában nincsen mód egy adott probléma- (téma- vagy jelenség.) 
körrel kapcsolatos összes adat tárolására, így adatoknak csak egy meghatározott, 
szűk körét kezelhetjük. A tárolandó adatok kiválasztásánál klasszikus modellezé- 
si szempontok érvényesülnek, azaz a vízsgálat szempontjából fontosnak tartott 
jellemzőket tároljuk, a többit elhanyagoljuk (jellemző alatt itt egyaránt értünk 
tulajdonságokat és kapcsolatokot ís). Így az odotbázis a világ egy darabjának egy 
leegyszerűsített képét adja vissza. 


Amikor ezt a képet elkezdjük kialakítani, követhetünk bízonyos konvenciókat, ami 
számos előnnyel járhat, A konvenciók egy része arra vonatkozik, hogy milyen 
formában, milyen kapcsolatok kialakítását támogassuk az adataink között és hogy 
milyen műveleteket engedjünk meg az adatainkon. Így ún. adatmodelleket hozunk 
létre, Természetesen, a konvenciókhoz való alkalmazkodás járhat hátrányokkal is, 
ez esetben megfontolandó egy teljesen egyedi adatmodell megalkotása. 


Egy adatmodell (data model) tehát hagyományosan két részből áll: 


1. formalizált jelölésrendszer adatok, adatkapcsolatok leírására 
2. műveletek az adatokon. 


Az adatmodell tulajdonságai alapvetően meghatározzák az ezt használó adatbázis 
tulajdonságait. A felhasználó számára pedig az adatbázisnak az egyik legfonto- 
sabb jellemzője az a forma, amelyben a tárolt adatok közötti összefüggések ábrá- 
zolva vannak. Az ábrázolás alapegysége a rekord, ill. a rekordtípus (vagy egy ezzel 
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analóg, de esetleg másképpen nevezett konstrukció). Mivel egy adatbázis struktú- 
ráját jelentős részben a rekordtípusok közötti kapcsolatok határozzák meg, ezért 
az adatmodelleket aszerint osztályozzuk, hogy a rekordtípusok között milyen kap- 
csolatok definiálása megengedett, azaz a felhasználó szempontjából miként valósul 
meg az adatok közötti kapcsolatok ábrázolása. 


A hálós adatmodellnél (id. 7. fejezet) a rekordtípusok között (pl. mutatók segít- 
ségével) tetszőleges függvényszerű kapcsolatokat szervezhetünk. A relációs adat- 
modellnél a kapcsolatok kialakítására nincs külön strukturális elem, magukat a 
kapcsolatokat is relációkkal ábrázoljuk (Id. 5. fejezet). Az objektumorientált adat- 
modell (ld. 8. fejezet) objektumokat tartalmaz, amelyek között változatos típusú 
kapcsolatokat hozhatunk létre, ezért sok szempontból a hálós adatmodellhez ha- 
sonlatós, 

Az adatmodell tehát meghatározza, hogy az adatbázisban az adatok milyen struk- 
túrában tárolódnak, és milyen mechanizmusokon keresztül lehet az adatokhoz 
hozzáférni. Így az adatbázis-kezelő rendszer legalapvetőbb tulajdonságait rögzi- 
ti. Egy adatbázis-kezelő rendszer ezért csaknem mindig egyetlen adatmodellnek 
megfelelően működik. 


4.2. Egy majdnem-adatmodell: az egyed-kapcsolat 
modell 


Az egyed-kapcsolat (entíty-relationship, ER) modell nem tekinthető a fenti érte. 
lemben adatmodellnek, mert nincsenek benne adatműveletek definiálva. 


4.2.1. Az ER-modoell elemei 
Az ER-modeli elemei: 


- egyedtípusok; 
— atiribútumtípusok 
- kapcsolattípusok 


Természetesen, a típusokhoz mindenütt tartoznak konkrét példányok (eset, előfor- 
dulás) is, de maga n modellezés a típusok szintjén történik. Összhangban azzal, 
amit általában típusnak nevezünk, a típus itt is a konkrétan létező -— de hasonló 
- egyedek, tulajdonságok, kapcsolatok absztrakciója. Az egyedek (tulajdonságok, 
kapcsolatok) bízonyos közös jegyek alapján halmazokba rendeződnek. Egy-egy 
halmaz neve az egyed (tulajdonság, kapcsolat) típusa, a halmazok elemei pedig a 
példányok. 


40 


4.2.1.1. Entitások 





Definíció - egyed, entitás f(entíty]. A valós világban létező, logikai vagy fizikai 
szempontból saját léttel rendelkező dolog, amelyről adatokat tárolunk. 





Megjegyzés. Ennek megfelelően az egyedeknek megkülönbőztethetőknek kell 
lenniük, mint ahogyan a matematikai értelemben definiált halmazok elemei is 
azok. Entitás lehet (!) egy autó, egy személy, egy szerződés, de még a szeretet is, 
hiszen megfelelő altribúturnok megválasztásával az nutók, személyek stb. megkü- 
lönböztethetővé tehetők, azaz ,saját létet rendelhetünk hozzájuk". Ugyanakkor 
általában nem tekinthető entításnak egy tojás vagy egy hangya, mivel a tojás- 
vagy a hangya-példányok rendszerint nem különböztethetők meg. 








Definíció - tulajdonság í(propcrty). Az entitásokat jellemzi, amelyen vagy ame- 
lyeken keresztül az entitások megkülönböztethetők, 





Megjegyzés. Valójában az entitások definiálása modellezési kérdés. A modell- 
alkotón múlik, hogy milyen tulajdonságokat rendel hozzá egy-egy entításhoz, így 
biztosítja-c azok megkívánt szintű megkülönböztethetőségét. Elképzelhető, hogy 
egy tudományos adatbázisban éppen hangyák adatait kell tárolni, amelyekkel 
különböző kísérleteket végeztek. Ekkor a hangyák megkütöntöztethetővé tehetők 
egy mesterségesen hozzájuk rendelt, egyediséget biztosító attribútummai (attri- 
bute) -— a gyakorlatban pl. az elkülönített tárolásuk segítségével -, Így a hangyák 
is entitásokká válhatnnk. 








Definíció - egyedhalmaz (cntity set). Az azonos attribútumtípusokkal jellem- 


zett egyedek összessége. 


Az entitások közös attribútumtípusait zárójelben szokás az entiításhalmaz neve 
után felsorolni, 


Példa. 


- EMBER(név, szül dátum, anyja neve, szeme színe, személyi szám) 
- SZERZŐDÉS(cégi, cég2, dátum, hely, szerződés tárgya, érték, 
telj határidő) 


4.2.1.2. Kapcsolatok 


A valóságban az egyedek ritkán léteznek elszigetelten, egymástól függetlenül. Ti- 
pikus az, hogy valamilyen kapcsolatban állnak egymással: az emberek cégeknél 
dolgoznak, szerződéseket írnak alá, egymással rokoni kapcsolatban lehetnek (pl. 
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testvére valakinek). Ezeket a tényeket kifejezbetjük, ha az entitáshalmazok között 
kapcsolattípusokat definiálunk. Természetesen ezeknek a meghatározása szintén 
modellezési kérdés; az adott feladat dönti el, hogy egy konkrét adatbázisban mi- 
lyen kapcsolattípusok definiálása szükséges. 


[ Definíció - kapcsolat (relationship). Entitások névvel ellátott viszonya. ] 


Formálisan egy kapcsolattípus nem más, mint entitás típusok névvel ellátott so- 
rozata. 


Példa. 


— DOLGOZIK: EMBER, CÉG 
Ez n bináris kapcsolattípus azt fejezheti ki, hogy valaki egy cégnél dolgozik. 
— ALÁÍR: EMBER, CÉG, SZERZŐDÉS 
Ez a ternáris (hármas) kapcsolattípus azt fejezheti ki, hogy egy személy egy 
cég nevében egy szerződést aláírt. 
-. TESTVÉRE: EMBER, EMBER 
Ez a bináris kapcsolattípus azt fejezheti ki, hogy az egyik ember testvé- 
re egy másiknak. Ennek a kapcsolattípusnak egy példánya - egy konkrét 
kapcsolat - pl. azt fejezheti ki, hogy Kis Géza testvére Kis Antalnak. 


A kapcsolntok ígen sokfélék lehetnek. Fontos szempont, hogy hány entitáshalmaz 
között teremtenek kapcsolatot, vagy hogy egy kiválasztott példány hány másikkal 
lehet kapcsolatban. Ezen belü! érdekes lehet, hogy egy kíválasztott példányhoz 
mindig tartozik-e egy vagy több másik példány, ha igen, akkor mennyi an kap- 
csolódó egyedek minimális, maximális száma stb. A kapcsolatok teljes mélységű 
jolemzése gyakran szükségtelen, mi is csak olyan mélységben fogjuk megtenni, 
amit a tervezett felhasználás indokol. 


Megjegyzés. A mindennapi gyakorlatban (sajnos) rendszerint elfeledkezünk a 
típusok (halmazok) és a konkrét példányok megkülönböztetéséről. Igen gyakran 
emlegetünk entitást, kapcsolatot akkor is, arnikor valójában entitás- vagy kapcso- 


lattípusról/halmazról van szó. Ez megtehető általában, mert a szövegkörnyezet 
miatt többnyire nem okoz félreértést ez a pontatlanság. Engedve a szokásnak, 
a továbbiakban nem hangsúlyozzuk a különbséget, ha ez kétértelműséget nem 
okoz. 








4.2.1.2.1. Kapcsolatok funkcionalítása (kardinalitás)  Említettük, hogy a 
kapcsolatok különbözhetnek pl. abban is, hogy egy entitáshalmaz egy eleméhez 
egy másik entításhalmaznak hány elemét rendelik hozzá. A legegyszerűbb csopor- 
tosításban egy-egy, egy-több vagy több-több kapcsolatról beszélünk. 


Definíció - egy-egy kapcsolat (one-to-one relationship). Olyan (bináris) kap- j 
-amelyben a résztvevő entitáshalmazok példányaivaLegy másik entitáshal- 

maznak legfeljebb egy példánya van kapcsolatban. 
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Példa. 


— HÁZASSÁG: EMBER, EMBER 
- FŐNÖK: OSZTÁLY, EMBER 






Megjegyzés (1). Vegyük észre, hogy egy kapcsolat funkcionalításának megha- 

tározása is modellezési kérdés. Általában (Magyarországon) igaz ugyanis, hogy 
a HÁZASSÁG egy-egy kapcsolat, hiszen egy emberhez (egy időben) legfeljebb egy 
másik embert rendel hozzá. Elégtelen lenne azonban a valóságnak ezen szintű 
modellezése, ha az adatbázisunknak olyan iszlám országban ís működnie kellene, 
abol a többnejűség is megengedett. j 


Megjegyzés (2). Egy-egy kapcsolatok még abban ís különbözhetnek, hogy az 
egyik entitáshalmaz példányai minden esetben kapcsolatban vannak-e egy másik 
entításhalmaz egy példányával, vagy nem feltétlenül tartozik hozzá egy másik 
példány. 

Az előbbi helyzetre jellemző a FŐNÖK kapcsolat, hiszen általában minden osztály- 
nak pontosan egy főnöke van. Ellenkező irányban mindez már nem feltétlenül 
igaz, hiszen az EMBER entításhalmaznak nem minden példánya kell, hogy főnöke 
legyen valamely osztálynak. 


A HÁZASSÁG kapcsolatban szereplő entításbalmazban lehetnek olyan személyek, 
akik egyedülállók, így egyik irányban sem teljesül, hogy egy kíválasztott példány- 
hoz feltétlenül tartozik is egy másik példány. 


Ezek a megfontolások a kapcsolatok mélyebb anolízisének lehetőségeire utalnak. 








Definíció - több-egy kapcsolat (many-to-one relationship), Egy K:; E1, E2 
kapcsolat több-egy, ha E1 példányaihoz legfeljebb egy E2-beli példány tartozik, 
míg E2 példányai tetszőleges számú E1-beli példányhoz tartoznak. 





Példa, TANUL: DIÁK, OSZTÁLY 


Itt tételezzük azt fel, hogy egy véletlenszerűen kiválasztott diák általában egy 
osztályban tanul (egyidejűleg), de egy meghatározott osztályba számos diák jár 
(egyidejüleg). 





több-több funkcionalitású, ha nem több-egy egyik irányban sém. 


Definíció - több-több kapcsolat (many-to-many relationship), Egy szsni 


Példa. TAN: DIÁK, TANÁR 


Ez a kapcsolat azt fejezheti ki, hogy diákok és tanárok ,tanítja — tanul nála" 
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viszonyban lehetnek egymással. A kapcsolat több-több funkcionalitású, mert egy 
tanár több diákot is taníthat, és egy diák több tanárnál is tanulhat, 


Az adatbázis-kezelésben a több-egy (egy-tőbb) kapcsolatok kitüntetett jelentősé. 
gűek, mert viszonylag egyszerűen ábrázolhatók, ugyanakkor elegendően általáno- 
sak, kifejezőek is. 


4.2.2. Kulcs 


Definíció — kulcs f(ixey). Az ER-modellezésnél az attribútumoknak azt a halma- 





zát, amely az entitás példányait egyértelmüen azonosítja, kulcsnak nevezzük. 








Példa. Az EMBER entitáshalmaz elemeit egyértelműen azonosítja a (név, 
szül dátum, anyja neve) attribútumhármas, vagy a személyi szám attribú- 
tum. Az EMBER entitáshalmaznak tehát két kulcsa ís van. 


Minden egyedhalmaznak legalább egy kulcsa mindig van, hiszen az egyedeknek 
megkülönböztethetőknek kell lenniük. Ehhez pedig az attribútumok teljes halma- 
za elegendő, tehát az attribútumok teljes halmaza mindig kulcs. A kulcs attribú- 
tumnait hagyományosan aláhúzással! jelöljük. 


4.2.3. Az ER-modecll grafikus ábrázolása: ER-diagram 


Bár az előbbiekben bevezetett formális jelölésrendszer elegendő az ER-modelt 
megadására, a gyakorlatban elterjedten használnak (különböző) grafikus megjele- 
nítési formákat ís. Mi most az eredeti jelölésrendszert mutatjuk be. 


egyedhalmaz 
(entitáshalmaz) 
áttelbútum CW 


kapcsolattípus Canyja. neve (Szem szám) 


4.1. ábra. Az ER-diagram elemei 
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a Lőn [var] 
a eteöto fesz] 
TANÁR 1 CTAND a 


4.2. ábra, Kapcsolatok funkcionalitásának egy ábrázolása az ER-diagramoknál 


Példa. A Nekercsdi Általános Biztosítónak számos kirendeltsége működik szer- 
te Nekeresdország városaiban, néhányban több is. Minden kírendeltségnek külön 
kódszáma ís van, amely egyértelműen azonosítja őket. A kirendeltségeken többen 
ís dolgoznak, de egy alkalmazott egy évben csak egy kirendeltségnél vállal mun- 
kát, A dolgozókat kódjuk egyértelműen meghatározza, de tárolni kell róluk még a 
nevüket, beosztásukat és fizetésüket ís, Az alkalmazottak időnként munkahelyet 
változtatnak - de mindig csak jarmár 1-jei dátummal -, és a Nekeresdi általános 
Biztosítón belül másik kirendeltséghez mennek dolgozni. 


A leírás alapján pl. az alábbi ER-modellt alkothatjuk. 
Entításbalmazok: 


— KIRENDELTSÉG(k kód, bely) 
- ALKALMAZOTT(a köd, név, beosztás, fizetés) 


Kapcsolattípusz 
- DOLGOZIK: KIRENDELTSÉG, ALKALMAZOTT; dátum 


A dátum attribútum - ami egy évszám, és azt fejezi ki, hogy egy adott évben mely 
alkalmazottak dolgoztak egy adott kirendeltségen — nem tartozik egyedül sem a 
kirendeltség sem az alkalmazott entitásokhoz, mindig csak a kettőhöz együtt. Az 
ER-modell azonban eddig nem engedte meg ilyen attribútumok definiálását, Meg- 
tehetjük, hogy ilyen esetekben a dátumot egy olyan entításhalmaznak képzeljük el, 
amelynek egyetlen attribútuma a dátum. Ezt egyszerűsítve úgy is ábrázolhatiuk, 
ahogyan az a 4.3. ábra ábrán látható. 


Megjegyzés. Mivel a diagramot a fenti ER-modell - és nem az eredeti leírás 
- alapján alkottuk, ezért nem látszik rajta, hogy a DOLGOZIK kapcsolathalmaz 


LN funkcionalitású. Természetesen ezt egy jobb, pontosabb diagramon akár áb- 
rázolhatnánk ís. 
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4.3. ábra. ER-diagram na fenti ER-modell alapján . 


Az ER-diagramok eszköztárát évtizedek alatt sokan, sokféle módon terjesztették 
ki, leginkább annak érdekében, hogy a gyakorlatban felmerülő számos különböző 
jelentést hordozó kapcsolatokat meg lehessen különböztetni. Így jöttek létre a 
különböző EER-diagramok (Extended ER). Az alábbiakban ennek néhány elemét 
mutatjuk be, 

Gyakori az a modellezési szituáció, amikor egy entításhalmaz minden eleme ren. 
delkezik egy másik (általánosabb) entiításhalmaz attribútumaival, de azokon kívül 
még továbbiakkal is (specializáció). Ez a viszony a kapcsolatok egy sajátos típu- 
sával, az ún. ,isa"?! kapcsolattal írható le. 


Példa. 





4.4. ábra, Specializáció ábrázolása ER-diagramon 


Az ísa kapcsolatnak az objektumorientált modelleknél kitüntetett szerepe van. 


Szintén gyakori, hogy a modellezés során egy entitáshalmaznak nem tudunk 
kulcsot meghatározni, hanem az egyedek azonosításához valamely kapcsolódó 
egyed(ek)re ís szükség van. Ebben az esetben gyenge egyedhalmazról (weak entity 
set) beszélünk. A gyenge egyedhalmaz identitását egy (vagy ritkán több) ún. tulaj- 
donos egyedhalmaz (owner entity set) biztosítja, amely a gyenge egyedhalmazzal 
több-egy kapcsolatban áll. A kapcsolat neve determináló kapcsolat (identifying 
relationship). 


! isa: angol. 
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A gyenge egyedhalmaz és determináló kapcsolatának szokásos jelölése a 4.5. Áb- 
ra diagramján látható, ahol a KURZUS egyedhalmoznaok nincs kulcsa, mert pl. 
a 2012/2013/1. félévben Gipsz Jakab több kurzust is vezethet. A kurzusokhoz 
a megfelelő tárgykódokat hozzárendelve lesznek az egyes kurzusok mint entítá- 
sok egyértelműen megkülönböztethetők. A KURZUS tehát gyenge egyedhalmaz, az 
INDUL a determináló kapcsolata, ezért a KURZUS példányok egyedisége csak a TÁRGY 
példányaiva! együtt biztosítható. 





4.5. ábra. Gyenge egyedhalmaz és n determináló kapcsolat ábrázolása ER- 
diagramon 


A gyenge egyedhalmaz példányait (a hozzájuk tartozó tulajdonos egyedhalmaz 
kulcs attribútumaival együtt) egyértelműen megkülönböztető attribútumokat n 
kulcs attribútumokhoz hasonlóan aláhúzással jelöljük. 


4.3. A fejezet új fogalmai 
modell, modell az adatokról, adatmodell, formális jelölésrendszer, egyed-kapcsolat 
(ER) modell, ER-diagram, entitás, kapcsolat, tulajdonság (attribútum), egyedtí- 


pus, kapcsolattípus, tulajdonságtípus, kapcsolat fokszáma, kapcsolat funkcionnli- 
tása (kardinalitása), isa kapcsolat, gyenge egyed, determináló kapcsolat, kulcs 
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5. fejezet 


A. relációs adatmodell 


A relációs adatmodellen alapuló adatbázis-kezelők ma a legelterjedtebbek, emiatt 
tanulmányozásuk kitüntetett figyelmet érdemel. Ezért a modell alapvető tulaj- 
donságait ismertető jelen szakasz után a relációs adatbázisok logikat tervezésével 
a 9. fejezet külön foglalkozik. 


5.1. Az adatok strukturálása 


A relációs adatmodell mögött a halmazelméleti relációk elmélete húzódik meg. A 
reláció szót ebben a szakaszban pontosan ebben az értelemben fogjuk használni. 


[ Definíció - reláció (relation). Halmazok Descartcs-szorzatának részhalmaza. J 


Adott n" (valódi, azaz azonos elemeket nem tartalmazó) halmaz. A halmazokban 
található értékek egy-egy ún. tartományból (domain) kerülnek ki. Legyenek ezek 
rendre Di, D2,. . ., Dn. A tartományok Dy x D2 x...x Da Dcscartcs-szorzatában 
megtalálhatók mindazok a (vi, V2,...,Un) n-esek ítupte, n-iupic, elem, rekord, 
ennes), amelyekre igaz, hogy v; € D;, Vi — 1,2,...,n-re. 


Példa. 
Di — (1,2,3) Dix D37 ( Hákés habe jött 
RÉ 1,y), 24 8y 
747 (12), (2.2) (3.2) ) 


Reláció lehet az így keletkezett n-escknek tetszőleges részhalmaza. Magát a relá- 
ciót névvel látjuk el, pl.: sz — ((1,y). (1.2). (3.299 r2— ((2.9.(1. 2) 


A modellben elvileg sem a domainek (domének) sorrendjének, sem az egyes reláci- 
ókban található elemek sorrendjének nincs érdemi jelentősége. Vegyük észre, hogy 
a relációs adatmodellben tárolt adatok csetén a hasznos információt lényegében 
az hordozza, hogy az egyes relációkban, ill. egy reláció elemeiten mely értékeket 
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tároljuk együtt (azon a trivialításon túl természetesen, hogy milyen adntok vannak 
a relációban). 


Áttekinthetőbben ábrázolhatjuk relációnkat táblázatos formában. Az oszlopokat 
(ezek az atiribűúttmok, amelyeknek szintén nevet adunk) hozzárendeljük n tar- 
tományokhoz, amelyekből az egyes oszlopokban található értékek kikerülnek. Az 
egyes attribútumok különböző értékeinek száma az attribútum kardinalitása. A 
táblázat sorai pedig a reláció elemei, az n-csek konkrét előfordulásai. A fejlécben 
az attribútumok megnevezése található. 






Példa. 
ri ra: 
Di] Da NÉV HELYSZÍN 
1 y Chao Phraya Bangkok 
1 z Kis József Budapest 
3 z Nagy Imre Bréma 


Láthatóan az adatelemekhez (számokhoz, karakterláncokhoz) rendelhető infor- 
mációt - többek között - az hordozza (vagy inkább csak sugallja!), hogy milyen 
neveket adtunk az attribútumoknak. Az elsőnek na NÉV nevet adtuk, amiből leg- 
inkább csak arra következtetbetűnk, hogy pl. a Chao Phraya egy tulajdonnév. A 
SZÁM - mint attribútumnév - még kevésbé informatív, a ELYSZÍN-ből pedig 
pl. annyit tudhatunk meg, hogy a , Bangkok" karakterJánc egy helyszínt (is) jelöl. 
A rekordhoz rendelhető információ — az adat értelmezése — jelen csetben tehát 
bizonytalan. 


További infornnációra akkor tehetünk szert az adatbázisból, In azt ís tudjuk, hogy 
a reláció egyazon elemének attribútumértékei összetartoznak. Az összetartozás 
szemantikája egyáltalán nem nyilvánvaló, és megfelelő dokumentáltság hiányában 
megfogalmazhatnánk pl. azt, hogy ,Chao Phraya egy 37 éves bangkoki lakos", De 
akár azt is, hogy ,n Chao Phraya utcában 37 ház van Bangkokban", azaz az ilyen 
módon dokumentált adatok segítségével kinyerhető információ értéke szinte zé- 
rus, A gyakorlatban súlyos tévedések forrása lehet, ha az attribútumok pontos 
jelentését csupán azok rövid neve sugallja a felhasználóknak, vagy a relációkhoz 
kapcsolódó szemantika nem/sem (kellően) definiált (Id. üzleti információs meta. 
adattár, szemantikus adatkezelés, információ-, ill. tudásmenedzsment). 


Gyakran magára a relációra nincs szükségünk, csak arra az információra, hogy 
melyik relációban milyen attribútumok találhatók. Ez a reldciós séma írelntional 
schema)!. Szokásos jelölése: R(A1, A2; . . . , Az), ahol R a relációs séma neve, Aj-k 
az attribútumok nevei, ahol 1 tig k. 


Példa. SZEMÉLY(NÉV, KOR, FOGLALKOZÁS) 


Ha egy s reláció sémája R, akkor azt így jelöljük: r(R). 


: Figyelem: egyes kereskedelmi adatbázis-kezelők a séma fogalmát más értelemben használják. 


49 


Bár általában nem okoz kétértelműséget, esetenként fontos, hogy a relációt, annak 
egy elemét, valamint a relációs sórnát megkülönböztessük egymástól. Általában azt 
a jelölési konvenciót alkalmazzuk, hogy a relációt és az elemeit kis, a relációs sémát 
pedig nagy betűvel jelöljük. 


Ha egy adatbázis több relációs sérnát is tartalmaz, akkor a relációs sémák összes- 
ségének neve adatbázis séma. 


További elnevezések: 


- A relációban lévő oszlopok (attribútumok, tartományok, tulajdonságok) szá- 
ma a reláció foka (arity, aritás). 

- A relációban lévő sorok száma (a konkrét előfordulások száma) a reláció 
számossága. : 


Az előbbiek következménye, hogy 


- a reláció nem tartalmazhat két azonos sort, . 
— az n-esek (sorok) sorrendje nem számít, 
a az oszlopoknak egyértelmű nevük van. 


Igaz továbbá, hogy az oszlopok sorrendje nem számít akkor, ha az oszlopokra a 
nevükkel hivatkozunk, de természetesen számítana akkor, ha csak a sorszámukkal 
hivatkoznánk rájuk. 

Megjegyzés. Ebben a tárgyban az oszlopok (attribútumok) sorrendjének nem 
lesz jelentősége, a relációs sémát lényegében egy attribúturnhaimaznak tekintjük. 
Létezik a relációs adatmodellnek olyan matemotikai felépítése is, amikor a doma- 
incknek, ill. nz attribútumoknak a sorrendje jelentőséggel bír, ilyenkor a relációs 
sémn valójában egy attribútumtista, természetesen csak ilyenkor van értelme a 
listaclemekre esetenként sorszámmal hivatkozni. A jegyzetben a precizitás rová- 
sára — különböző helyeken - mindkét módon hivatkozunk az attribútumokra, ha 
azt a könnyebb érthetőség indokolja. 





5.2. Műveletek relációkon 


A relációs adatmodell a relációkon megengedett műveletek meghatározásával válik 
teljessé. Ezen műveletekből épül fel az ún. relációs algebra (relational algebra). 
Tekintve, hogy a relációk is halmazok, mégpedig valódi halmazok (ismétlődés 
nem engedhető meg bennük) néhány halmazalgebrai műveletet relációs algebrai 
műveletként is fel kívánunk használni. 
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5.2.1. Egyesítés, unió (sect union) 


Az egyesítés feltétele, hogy az egyesítendő relációk sémáinak ugyanannyi attri- 
bútumból kell állniuk.? Nem szükséges azonban, hogy czek ténylegesen nzonos 
attribútumokat jelentsenek. Tehát n műveletet ilyenkor mindig el tudjuk végezni, 
de nem biztos, hogy az eredmény attribútumait sorszámukon kívül nevükkel is 
azonosítani tudjuk. 


Példa. 
Tp Te: TP UTeo 
A B c D E F 
a b [3 a c d 
c b a a d c 
a d c b b [c 





5.2.2. Különbségképzés (sect difference) 


Ugyanazok a megkötések érvényesek a különbségképzés műveletre, mint nz egye 
sítésnél. 


Példa. 
ri ro; rA re 
A B c 1 2 3 
a b c A b c 
c b a c b a 
a d ce 





Bevezethetnénk a metszetképzés (set intersectjon) műveletét is, azonban ez szük- 
ségtelen, mert a különbségképzés segítségével a metszet kifejezhető: 


ANB z AM(AN B). 


5.2.3. Descartes-szorzat (Cartcsian product, cross product) 


A reláció definíciójánál leírtaknak megfelelően az ry xra Deseartos-szorzat erediné- 

nye az összes olyan (ni b n2)-esekből áll, amelyeknek első ni attribútuma az első 

operandusból, második n? attribúturna a második operandusból származik, ebben 

a rögzített sorrendben. Az opcrandusok szerkezetére ebben az esetben semmilyen 

megkötést nem kell tennünk. 

2 Eza korlátozás csak a relációs adatmodell implcmentálását könnyíti meg, hiszen a halmazel- 
méleti unióképzésnél nincs ilyen megszorítás. 
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Tg: ro TpX Fe 
A B A D 
a b e d 
b a a c 





5.2.4. Vetítés, projekció (projcction) 


A vetítés egyoperandusos művelete azt jelenti, hogy a reláció összes rekordjának 
egyes attribútumnit megtartjuk, a többit pedig töröljük. Ennek során ki kell je- 
lölnünk, hogy mely attribútumokat kívánjuk felhasználni.? 


Példa. 

Adott egy GÉPKOCSKÁR, RENDSZÁM, ÉVJÁRAT, ELSŐ. TULAJDONOS, 
VIZSGA ÉRVÉNYESSÉGE, TÍPUS, FOGYASZTÁS) sémára illeszkedő reláció. 
Ekkor a 7 yypus éVJÁR AT,POGYASZTÁS (gépkocsi) vetítés a gépkocsi reláció n- 
eseiből csak a TÍPUS, ÉVJÁRAT, FOGYASZTÁS azonosítójú attribútumoknak 
megfelelő hármasokat tartja meg. 


A művelet implementációjakor, amennyiben az eredményben ismétlődések fordul. 
nának elő, azokat meg kel! szüntetni. 


5.2.5. Kiválasztás, szelekció (selection) 


A kíválosztás egyopcerandusos művelete egy részhalmaz képzése az r reláción, 
amelynek vezérlésére egy logikai formula szolgál. Az r reláció minden elemére ki- 
értékeljük a formulát, és azokat az elemeket vesszük be az új relációba, amelyekre 
a formula igaz értéket vesz fel. 


Jelölése: ep(r), ahol sz F logikai formula a, szelekciós feltétel, 
A logikai formula kvantormentes, és a következő elemeket tartalmazhatja: 


— konstansokat vagy ft attribútumainak azonosítóit, 
- aritmetikai összehasonlító operátorokat (c — 5 2 £) és 
- logikai operátorokat (A V -). 


Példa. A T KOREZSANÉV-! Kovács! (névsor) kifejezés a névsor reláció azon eleme- 
inek halmazát jelenti, amelyeknek KOR azonosítójú attribútuma kisebb huszon- 
háromnál, NÉV azonosítójú attribútuma pedig Kovács. 


5 Ha az előző lábjegyzetnek megfelelően attribútumhalmazok helyett attribútumlistákka) dol- 


gozuak, akkor az egyes attribútumok sorszámukkal is azonosíthatók. Pl.: R(Ai1, Az, ... Aa) 
esetén a s. s.7.1(r) jelölés azt írja elő, hogy vegyük az r reláció első, harmadik, hetedik és má- 
sodik attribútumát és ebben a sorrendben vegyük fel az új relációba az attribútumok értékeit. 
Az eredményreláció sémája tehát S(Ai, As, Az, Az) 

Attribútumlistás reprezentáció esetén az egyértelműség érdekében a numerikus konstansokat 
ís aposztrólok közé írjuk, hogy meg lehessen különböztetni az attribútumok sorszámától. 
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Az 5.2.1-5.2.5. szakaszokban definiált műveletek a relációs algebra alapművetletet, 
Az alapműveletek láthatóan relációkat állítottak elő relációkból, a műveletek tehát 
zártak a relációk halmazára. Segítségükkel ugyanakkor változatos manipulációknt 
végezhetünk a relációinkon, néha akár többféle módon is. Ennek ellenére célsze- 
rű további, ún. (telszármaztatott műveleteket is definiálni, mint pl. a különböző 
illesztések vagy a hányados műveletét, amelyekkel gyakori, viszonylag bonyolult 
műveleteket lehet nagyon tömör formában leírni. 


5.2.6. Természetes illesztés (natural join) 


Ez a művelet különösen nagy jelentőséggel bír majd a relációs adatbázisok logikai 
tervezéséhez kapcsolódóan (ld. 9. fejezet). 


Adott két reláció, amelyeknek tipikusan van legalább egy - de akár több - meg- 
egyező nevű attribútuma. Vegyük sorra a két reláció minden rekordját (clemét), 
és válasszuk ki azokat, amelyeknek a megegyező nevű attribútumai érték sze- 
rint is megegyeznek. Fűzzük össze ezeket olyan rekordokká, amelyben n mindkét 
relációban szereplő, azonos nevű és értékű attribútumokat csak egyszer vesszük 
figyelembe, Ezen rekordokból képzett reláció lesz a természetes illesztés eredmé- 
nye. 

Mivel származtatott műveletről van szó, ki tudjuk fejezni a fenticket az alapmű- 
veleteink segítségével ís: 


Legyen f és S a két adott reláció sémája. Legyenek XI, X2,..., Xn az azonos 
attribútutmnevek. Ekkor 

Tsz TRUSO(R.XpES.XgJA...MR.Xnz5.Xn) (TX 5) 
Az RUS kifejezésben az unió művelet garantálja, hogy az azonos nevű nttribú- 
tumok csak egyszer fordulnak elő az eredménybalmaz séimájában. 


Vegyük észre, hogy közös nevű attribútumok hiányában a természetes illesztés 
Dcescartcs-szorzatba megy át. 


Példa (1). Kövessük végig mindezt egy egyszerű példán: 


r s: TX: 
A B A c A 
a b a c 
a c b c 
b b 
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gRAcsA(rx s) TABCIR.AcsAÍrx s) rite 
A B c 


a b c 
a c c 
b b c 





Példa (2). Adott az osztály nevű reláció, amelynek az elemei azt tartalmazzák, 
hogy egy adott nevű személy melyik osztályon dolgozik, továbbá a személy reláció, 
amely megmondja, hogy egy adott nevű személy hol lakik és mikor született. 
A példa két relációs sémája: 

- OSZTÁLY(WÉV, OSZT NÉV) 

- SZEMÉLY(NÉV, LAKCÍM, SZÜL DÁTUM) 


Mindazok lakcímét, akik a Pénzügyi Osztályon dolgoznak nem fejezhetjük ki egye- 
dül egyik reláció segítségével sem, csak úgy, ha a két reláció megfelelő elemeit 
(a közös NÉV attribútumon keresztül, pl, a természetes illesztés műveletével) 
összekapcsoljuk. Az így kapott osztály b4 személy reláció tartalmazza minden 
olyan személy nevét, osztályának nevét, lakcímét és születési dátumát, akik neve 
mindkét relációban szerepelt. Így tehát már egyetlen relációban megtalálható az 
összes szükséges adat. Ebből kell kíválasztanunk azokat a sorokat, amelyekben az 
OSZT. NÉV pl. a Pénzügyi Osztálynak felel meg (PO), majd vetítenünk kell az 
eredményt a kérdéses attribútumokra: NÉV, LAKCÍM. 


Formálisan; mé LAKCÍMTOSZTANÉVa PO (osztály 4 személy) 
Természetesen ugyanerre az eredményre más úton is eljuthatunk. 


Felmerülhet olyan igény ís, hogy az eredményreláció tartalmazza az osztály dol- 
gozóinak nevét még akkór is, ha az illető neve nem szerepel a másik relációban, 
tehát lakcíme, születési dátuma nem ismert. Ilyenkor az ún. külső illesztés (outer 
join) műveletét alkalmazhatjuk. Ilyenkor a hiányzó adatok helyén NULL értékek 
fognak szerepelni (NULL-lal jelöljük, ha valamely attribútum értéke nem ismert, 
nem meghatározott). 


5.2.7., 9-illesztés (O-join, theta join) 


Legyen r és $ két reláció, 9 pedig egy kvantormentes feltétel, melyet az rés s 
relációk egy-egy attribúturna, között definiálunk. A táblák Descartes-szorzatából 
a rekordpáron értelmezett 0 feltétel szerint választunk ki sorokat: t— ag (r.x 5). 
Az így definiált t reláció állítja elő az rés s relációkon végzett 8-illesztés műveletet. 
Jelölése: ru s 


Példa. Nézzük két egyszerű példát. 
5 Ttt hallgatólagosan azt is feltételezzük, hogy az azonos nevű attribútomokhoz azonos szemen: 
tika tartozik, hiszen valójában számunkra ez a föntös akkor, amikor a helyes lakcímet meg 
akarjuk kapni. Ha csak formálisan végzünk el valamilyen ilfesztést azonos nevű attribúto- 
mok mentén, akkor az eredményreláció elemeihez nem feltétlenül fogunk tudni használható 
információt hozzárendelni. 
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"po" "gep" 
AlB AlBI]C 
alb n]atd 
alb alald 
aijb alald 
ala atbíc 
ald ainid 
cÍfd blcíe 





5.2.8. Hányados (division) 


Jelölje rs-s azt a relációt, amelyre ígaz az, hogy az s-sel alkotott Descartcs-szorzata 
a lehető legbővebb részhalmaza r-nek: (r- s) xs € r. Ezzel a relációval definiáljuk 
a relációs algebra r és s relációk között értelmezett hányados műveletét, 


Példa. Nézzük egy egyszerű példát. 


n s; F-bs: 
A B c D 
a b a f 
e f e d 





5.2.9. Példák a relációs algebra alkalmazására 
Egy boltban az alábbi adntokat gyűjtik: 


- záróösszeg (a pénztár tartalma a nap végén) (ÖSSZEG) 
- azonosító (DÁTUM) 
- az eladott áru neve (ÁRUNÉV) 
— darabszáma (DB) 
- kódja (ÁRUKÓD) 
- egységára (EGYSÁR) 
Minden nap zárás után a pénztárban lévő pénzt a bankba szállítják, kívéve 


4000 Ft-ot, amit a pénztárban hagynak másnapra váltópénznek. Így an bankba 
ÖSSZEG — 4000 kerül (BEF(2). 

A 9.1. szakaszban meg fogjuk konstruálni ehhez a feladathoz az alábbi relációs 
sémákat, melyeket most megelőlegezünk: 


- ÁRUGÁRUKÓD, ÁRUNÉV, EGYSÁR) 
- MENNYISÉG(DÁTUM, ÁRUKÓD, DB) 
- BEVÉTEI(DÁTUM, ÖSSZEG) 
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- BEFIZÖSSZEG, BEFIZS 
Ezen sémákra illeszkedő relációk segítségével fcjezzük ki az alábbi relációkat: 


- Az 1997. jan. I. és utána következő napok bevételei a dátummal együtt: 


ODÁTUAT2?19970101" (tevétel) 


- Ha meg akarjuk cserélni az attribútumok sorrendjét: 


TÖSSZEG DÁTUMT DATUN2 19970101 (bevétel) 


- Az 1997. jan. 15-i bevétel és a befizetett összeg (első közelítésben): 


TÖSSZEG BEFI29 DÁTUMDU"19970115" (bevételt 4 befíz) 


Ebben a formában az eredményrelációt költséges lehet előállítani, ha a 
bevétel és befiz relációk nagyméretűck. Vegyük észre, hogy ugyanerre az 
eredményre jutunk, ha előbb a kiválasztás műveletét végezzük el, majd ez- 
után (egyetlen sorral!) a természetes illesztést: 

TÖSSZEG BEFIZ ((e DATUM 19970115" (bevétel) ) ba befiz) 


feleebot nézlek a természetes illesztés helyett az alapműveleteket ís használ- 
atjuk: 


TÖSSZEGBEPIZ VDÁTUKa "199701 1VADEFIZ,ŐSSZEG e BEVÉTEL. OSSZEG (bevétel x befi) 


- Hál darabot adtak el 1997. jan. 15-én az Al kódú áruból, mi a neve és az 
ra? 


TOGÁRUNÉV.EGYSÉGÁR TÁNYKÓDOTAVADÁTUNKm10970119" (mennyiség bd áru) 


- Melyek azok a napok, amikor mindenféle áruból adtak el? 


(7pA TUMARUKÓDTMENNyiség) —- Tt E RuKÓpÍTU 


5.3. Relációs lekérdező nyelvek (relational guery 
languages) 
A legtöbb relációs adatbázis-kezelő rendszer lekérdező nyelve alapvetően 


— relációs algebra (pl. ISBL) vagy 
- relációs sorkalkulus (pl. OUEL) vagy 


am 
§ Megjegyzendő, hogy nem szerencsés az adatbázis sérnába felvenni BEFIZ attribútumot, amely 
származtatott értékeket tartalmaz, de egyéb szempontok miatt most tekintsünk el ettől. 
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- relációs oszlopkaikulus (pl. SOL, OBE) 


jellegű. Mint az elnevezések is mutatják, a nyelvek részben algetra, részben 1o- 
gikai, kalkulus jellegűek. A relációs algebra és annnk lehetőségei már ismertek 
az 5.2. szakaszból. Itt azt célszerű hangsúlyozni, hogy a relációs algebra segít- 
ségével megfogalmazott adatbázis lekérdezéseknél explicit módon elő kel! írnunk, 
hogy mely reláción vagy relációkon milyen műveleteket milyen sorrendben kell 
elvégeznünk ahhoz, hogy a kívánt eredményt megkapjuk. Mint látni fogjuk, a 
logikai, kalkulus alapú nyelvek csak azt igénylik, hogy nz eredményhalimaz eleme- 
inek tulajdonságaira vonatkozóan megfogalmazzuk az elvárásunkat. A lekérdezés 
ezután automatizálható, söt, többféle lehetőség közül választva optimalizálható 
is annak érdekében, hogy minél kevesebb művelettel /leggyorsabban juthassunk el 
az eredményhalmazhoz. A relációs lekérdezéseknek ez a lehetősége volt az egyik 
legjelentősebb tényezője a relációs adatbázis-kezelők sikerének,? 


6... 


5.3.1. Relációs sorkalkulus (tuple relational calculus) 


A relációs sorkalkulus (a továbbiakban: sorkalkulus) egy elsőrendű nyelv.§ amely 
tehát kvantorokat (guantifer) is tartalmazhat és a kvantorok sorvéktor változókat 
kvantifikálhatnak. 


Felépítése: a nyelv szimbólumaiból atomokat (alapformulákat, prímformulákat) 
hozhatunk létre, amelyek formulákká építhetők össze, a formulák pedig egy kife- 
jezésbe építve alkalmasak arra, hogy segítségükkel relációkat írjunk le. 


Szimbólumai (symbol): 


- zárójelek: (, ) 

aritmetikai relációjelek: c. 3... § 2 
logikai műveleti jelek: -, A, V 

sorváltozók: s(n), n változós 

sorváltozók komponensei: sag, ahol igign 
- (konstans) relációk: RÍ), m változós? 

-— konstansok; c 

- kvantorok; 3, V 


Az atomok (atomic formulac) felépítése: 
— Rím) (sm) 
- s(rgo u tj], ahol 1 gign,1£j Ek és 0 aritmetikai relációjel 
- srac 
- RÉV (c 024... €n) 


T A lekérdezések deklaratív megfogalmazásának lehetőségén kívül. 
Ld. matematikai logika, formátis nyelvek. 

9 A kalkulus kifejezésekné) - a korábban használt konvencióval ellentétben - a retációkat nagy- 
betüvel Írjuk, hogy megkülönböztethetők legyenek a sorváltozóktól. 
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A formulák (formulae) felépítése: 


- minden atom formula, 

- ha VI és Wa formulák, akkor Vj A V2, Vy V V2, -V1 ís formulák, 

- ha § formula és s(n) egy szabad sorváltozója (free tuple variable), akkor 
(as) V és (vsín)) 4 is formulák!0, amelyekben s(") már kötött sorváltozó 
(bound tuple variable). 


A kifejezések (expressions) felépítése: 
fenjeejy, 


ahol síma w (s) formula egyetlen szabad sorváltozója. 
Példa. 


- atomok: R(6) (50), s9f c ut 
- formulák: RÍD (2) APA] 2 ci, (vel) R5) (165) ) v.a(0y] £ ez 


A bemutatott formaliízmusnak készítsük el egy interpretációját (értelmezését) rög- 
zítve, hogy a változók és a konstansok milyen értékeket vehetnek fel. Ehhez meg 
kell adnunk ezeknek az értékeknek a halmazát, ez lesz a formulához tartozó in: 
terpretációs halmaz (domain of discourse), Az egyszerűség kedvéért most minden 
változóhoz és konstanshoz egyetlen közös halmazt rendelünk hozzá. 


Legyen pl. A tetszőleges, véges, számítógépben ábrázolható számhalmaz. Tételez- 
zük fel, hogy c € A, s(1) e AB, RÍ) c AM, 


Ezen interpretációs halmaz elemeit felhasználva a sorváltozók minden komponense 
értéket kaphat, ami után minden formulához egy igazságérték rendelhető. 
Az igazságértékek (truth valucs) meghatározása: 
- RÍ) (sm) pontosan akkor igaz, ha s(m) e RÍ), s(m) a Am, 
— sírj e ulj], továbbá s(M[(jjJ ge pontosan akkor igaz, ha az értékekre 
fennáll a 8 aritmetikai reláció (sí) e AP, ulk) c AF ee A). 
- RÉ (ej, c2, . . .. €a) pontosan akkor igaz, ha (er, c2,....€n) e RÍP? (ez e A). 
- Wi szabad sorváltozói az sr € At, t — 1,2,... rt, értékeket, míg 42 
(ks Éz 
szabad sorváltozói a v.)) e Afj, j — 1,2,... ,ro értékeket veszik fel, akkor 
9 VA Va pontosan akkor ígaz, ha V] és Ve is igaz. 
0 Vi V Va pontosan akkor igaz, ha V1 vagy Va igaz, 





19 A kvantor hatóköre a sor végéig, ill. zárójelezett formula - pl. (29). ; 2) — esetén a bezáró 
zárójelig tart. 
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zel smmégásál Ká áeíalánááétók 
enm 


9 -WVy pontosan akkor igaz, ha §y hamis. 


- Ha Vy szabad sorváltozója I(£) és sorváltozói az sí E At (t —1,2,...,r) 
értékeket vették fe), akkor 


o (a) v (ze, 391, 412), gú; ab) pontosan akkor igaz, ha van 
olyan uth) e AK , amelyre § dat age. ji sír ) igaz, továbbá 

o (vi() ) y (2623, sét), 5412), Bőzú sé) pontosan akkor ígaz, ha minden 
4) € AF esetén V (u, hr) 5472), Hl sr) igaz, 


A kifejezések interpretációja: (59 w ( sím) ) 4 pontosan azoknak az sír) e AM. 
eknek a halmaza, amelyekre a 4 formula ígaz. A kifejezések tehát olyan relációkat 
határoznak meg, melyek attribútumértékei A elemei közül kerülnek ki. Ezt fogjuk 
a továbbiakban adatbázisok tartalmának lekérdezésére használni, 


Az adatbázisok tartalma azonban időben változik, így egy interpretáció csak egy 
adott időpillanatban teszi lehetővé az adatbázis lekérdezését, Az idő múlásával 
változnia kellene az internretációnak is. Ami nem változik, azok a formális nyelv 
elemei. Ezért ezt basználhatjuk lekérdezésre különböző időpontokban, 


A továbbiakban a formális jeleket és az interpretációjukat nem különböztetjük 
meg, nem tüntetjük fel továbbá mindenütt a sorváltozókban a változók darabszá- 
mát valamint a relációk fokszámát. 


Példa (Az 5.2.9. atszakasz relációit fejezzük ki ismét). 


- Az 1997. jan. 1. és az utána következő napok bevételei a dátummal együtt: 
(DÍBEVÉTELG) A tf] 2 "19970100) 
- Az 1997. jan. 15-i bevétel és a befizetett összeg: 
( uj BEFIZ(u) A (3v) BEVÉTEL(v) A v[1] — "19970115" A u[2] — ul) 


- Hány darabot adtak el 1997. jan. 15-én az AZ kódú áruból, mi a neve és az 
ára? 
(50 [E MENNYISÉG(u) A (3vjÁRU[vjA 
u[i) — 19970115" A uf2) e "ALA v[1] "ATA 


s(1) — u[3] A 5[2]) — v[2] A s[3] — vis) ) 
Természetes módon adódik a kérdés, hogy van-e olyan , jó" a sorkalkulus, mint a 
relációs algebra, azaz minden relációs algebrai kifejezéshez meg tudjuk-e konstru- 


álni annak sorkalkulus megfelelőjét? A választ pontosabban az alábbi tétel adja 
meg. 
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"Tétel. Minden, az RÍ c Afk, (k—1,2,...,r) relációkból felépített E re. 
lációs algebrai kifejezéshez van olyan V (sm) sorkalkulus formula, hogy 


csak az RU) közül tartalmaz relációkat és az E kifejezés megegyezik az 


(sej v (59) ) kifejezéssel. 


Bizonyítás. Az E kifejezésben található műveletek száma n szerinti teljes in- 
dukcióval. 

n a 0, azaz nincs művelet £-ben. E szükségszerűen egyetlen relációt tartalmaz, 
legyen ez a k-ik. Ekkor V (544) z RK) (str ) miatt teljesül az állítás. 

T. f. h. a legfeljebb n műveletet tartalmazó £ relációs algebrai kifejezésekre az 
állítás még igaz. Igaz-en- 1 műveletre is? Vizsgáljuk meg az öt relációs algebrai 
alapművelet szerinti esetszótválasztással az n 4 1 műveletet tartalmazó relációs 
algebrai kifejezéseket. 

Igaz volt tehát, hogy E), E2 rendre ny.n2 £ n műveletet tartalmazó reláci- 
ós algebrai kifejezéshez létezik Viz (5) , V2 fé) sorkalkulus formula, hogy 


E) a (69]va úg és E2 z 2 4 (62). 


1E7-EUE tt x 5 1 és ny 4 n2 — n. Pontosan ekkor lesz £1 UE 
elvégezhető, an 4 1 műveletet tartalmazó relációs algebrai kifejezés. Ekkor 


sz£Ez (10 vi (ez) VWVa (120) ) az Ep U E2 megfelelője. 


2E7-ENEÉ2ltt Ty s x2 és ny 4 n? — n. Pontosan ekkor lesz E) § £ 
elvégezhető, m 4 1 műveletet tartalmazó relációs algebrai kifejezés. Ekkor 


az Ez (ev v4 (ez) A wa (22) ) ) az E) 4.52 megfelelője. 
3. E — E) x Ez, ami pontosan az ny 4 n2 — n esetben nk 1 műveletet tar- 


talmazó, elvégezhető relációs algebrai kifejezés. Ekkor az E) x E? kifejezés 
sorkalkulus megfelelője. j 


E a (devvz[ (50) (2672) net) a vat a 


eza trsodíaj z tg] A.A tlízitzd[gi] ETV gyja 
ezrtzdg 1] sz 0 pa] A...A tlratzolrj4-zo] — 0 tre) 








4 E sz Tip ágy (E). Ittni s nésl £ ij,f2,...,iy S mi. A kifejezés 
sorkalkulus megfelelője: 


Ez (jee e (41) A gy — ÉV fája 
elve) — ÁD ig] A... a ely] az EV tiy1) 





e na a ET Te tt a an se —— 


] 


5. £ s or(£). Itt ny — n. A kifejezés sorkalkulus megfelelője: § :z 
(ez0] vi (íz) AF), ahol F" úgy kapható az F logikai formulából, 
hogy az Ej eredményreláció sémájának í-ik (1 £ if £ z) attribútumá- 
ra történő hivatkozást tíz) [i-vel helyettesítjük. Ekkor belátható, hogy f" 
sorkalkulus formula lesz, melynek egyetlen szabad változója tíz) és esnk 
olyan relációkat tartalmaz, nmelyeket F is tartalmazott. 


Az esetszétválasztás az összes relációs algebrai alapművelet, mint a kifejezés 7z--1- 
ik művelete esetén megmutatta, hogy létezik a keresett WV (sír) sorkalkulus 
formula, ha teljesül az indukciós feltétel, 


Összegezve tehát megállapítható, hogy a sorkalkulus kifejezőereje (expressive 
power) legalább akkora, mint a relációs algebráé. 


A tétel megfordítása semmiképpen nem igaz, hiszen a 


£ - (69]-x (9) 


relációt nem tudjuk a relációs algebra alapműveleteivel kifejezni, Tehát a sorkal- 
kulus kifejezőereje nagyobb, mint a relációs algebráé. 





Ez önmagában még nem lenne baj, azonban a sorkalkulusnál kiértékelési prob- 
lémák ís felmerülhetnek. Az előbbi relációnál pl. ha f-nek csak egyetlen eleme 
(sora) van, akkor £ elemeinek száma JAJ" 1, ami a választott A (emlékezzünk, 
hogy A akár tetszőlegesen nagy, de véges, számítógépben ábrázolható halmaz) 
mellett már kis n-ek csetén ís ábrázolhatatlanná teheti az eredményhalmazt.!b A 
probléma úgy is jelentkezhet, hogy csak a részformulák eredményeiként keletkező 
közbenső relációk nönek kezelhetetlen méretűvé, magn a végeredmény már nem 
ilyen. 2 Mivel cz implementációs problémákat okoz, ezért célravezetőnek tűnik n 
sorkalkulus szűkítése. 


5.3.1.1. Biztonságos sorkalkulus (safe tuple relatlonal calculus) 


A probléma megoldására vezették be az ún, biztonságos (sorkolkutus) kifejezéseket 
(safe expression). A cél az, hogy a sorkalkulus kifejezés kiértékelhető legyen számí- 
tógépben kezelhető méretű relációk/véges idő mellett is. Az alapgondolat pedig, 
hogy le kell szűkíteni azon változóértékek halmazát, amelyek a sorkalkulus kife- 
jezés formuláját igazzá tehetik egy olyan halmazra, amely magából a bemeneti 
relációkból és esetleges egyéb konstansokból áll. Ez a. halmaz a formula döménje, 
DOMÍN) lesz. 

H Ilyenkor kvázi végtelen (eredményjhalmazról beszélhetünk, 


13 Vegyük észre, hogy a relációs algebra a definiált 5 alapmüveletével zárt abban ez értelemben, 
hogy véges relációkból véges relációkat állít elő. 
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Definíció — formula doménje (domain). DOM(W) 5 (V-beli alaprelációk összes 
atiribútumának értékei) U (9-ben előforduló konstansok) 











tm TET E 1 a A an ua gaz ag 


DOM(Y) tehát egy egydimenziós halmaz. 
Példa. W (02) eni (zo z 28) AR (02) esetén 


DOM(Y) s (28) U r1 (r(R)) U 72 (r(R)) . 





Definíció - biztonságos kifejezés (safe ezpression). (t(w(t)) biztonságos, ha 
a) minden Ví(Z)-t kielégítő t minden komponense DOM(W)-beli, és 
bd? V-nek minden (Hi) w(t) alakú részformulájára teljesül, hogy ha u kielégíti 
wet Az tw-beli szabad változók valamely értéke mellett, akkor t minden 
komponense DOM(w)-beli (a részformula biztonságos). 


A definició a) része a formula szabad változójára, 6) része pcdig a kötött változóita 
ír elő kényszert. 


Módszerek biztonságosság eldöntésére: 


- (Hu) R(u) A... alakú formulák mindig biztonságosak t-ban. 
- (vujwtíu) alakú részformulák ekvivalensek — (Ju) —w(ti)-val. 





Megjegyzés. Egyes szerzők egy harmadik feltételt is definiálnak, hogy az ellen- 
örzéshez ne kelljen átalakítani az univerzális kvantort tartalmazó részformulákat: 


c) Y-nek minden (Vu) w(t) alakú részformulájára teljesül, hogy ha tt valamely 
komponense nincs DOM (w)-ban, akkor u kielégíti a-t az w-beli szabad 
változók minden értéke mellett. 


Ez a feltétel levezethető a 6) feltételből az alábbiak szerint. Tudjuk, hogy 
(Vu) wíu) formula ekvivalens a -í(Ju) -wíu) formulával. A 5) feltétel miatt 
a (34) wíu) akkor biztonságos, ha a (Ju) -u(u) részformulára teljesül, hogy 
ha u kífelégíti w-t az w-beli szabad változók valamely értéke mellett, akkor u 
minden komponense DOM (-w)-beli. Jelölje t et DOM (a) azt, hogy Z minden 
komponense DOM (a)-beli, ekkor formálisan: (Ju) -w(u) akkor és csak akkot biz- 
tonságos, ha Vup-ra -w(ug) - ug €" DOM (-w). Az implikációt" átalakíthatjuk 
az AZ Bs -ÁAV B azonosság alapján, így a feltétel: w(ug) vV ug € DOM (-w). 
A domén definíciója miatt DOM (-w) - DOM (w), hiszen -w ugyanazokat az 
alaprelációkat és konstansokat tartalmazza, mint w, ezért a feltétel w(ug) V ag € 
DOM (w). Átrendezve - (ug £" DOM(w)) v.g(ug), amit átírhatunk íimplikációra: 
Vugrra ug 8" DOM(w) 5 wíup). Vagyis minden doménen kívüli ug elem kielégíti 
1-t az w-beli szabad változók minden lehetséges értéke mellett. 
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. Az itpilikációt Id. részletesebben az A. függelékben, 





Példa (Biztonságos kifejezések). 


— (ER) A (te) ), feltéve, hogy Y(t) részformulái biztonságosak. Ugyanis 
minden t, amely f(t) A V(t)-t igazzá teszi, eleme kell, hogy legyen A(f)- 
nek is, azaz eleme DOAf (R(t) A Vít))-nek is. 

— (elR(LD) A S(D) h. (EIR(t) A -S(t) ) hasonló okok miatt. 

- fel(Ri(t) v. Ra) v...V.R(D) A Ve), 

- fél (Bra) (Bva). .. (Bu) Ri(tu1) A Ro(u2) A... A Rp(up) A 


1110 7 agy [a A 2] — viz [2] A... A elm — vin [do] A V (tpnu2,. 1) 
mert minden tÍn] komponens valamely ft; reláció egy attribútumának érté- 
kére van korlátozva. 





Összetett kifejezés biztonságosságának vizsgálata, Vizsgáljuk meg a 
(42) ALU] 2 2A((3u) op (t, u) A Ro(u)) A ((vv)ftzfv] VA (t,v))) 


kifejezés biztonságosságát, ha tudjuk, hogy s (z,y) és A(z, y) biztonságos formu- 
Ják! 


— Az első feltétel teljesül, mivel a kífejezés formulája (Jtj(t) A...) alnkú, ezért 
az összes, formulát kielégítő Z csak fy-beli értéket vebet fel. 
- A második feltételhez mindkét kvantort tartalmazó részformulát megvizs- 
gáljuk: 
9 a (du) -yr (tp u) A Rola) részformula biztonságos t-ban, mive) nz összes, 
(74 (4, u) A Ro(u)) formulát igazzá tevő u kizárólag az 2 reláció elemei 
közül kerülhet ki, 
o a (Vv) -ftz(v) V A (tv) univerzális kvantort tartalmazó részformulát 
először alakítsuk át a következőképpen: - (Ju) fts(v) A 54 (tv). 


Mivel a kifejezés kiclégíti a biztonságosság mindkét feltételét, így a kifejezés biz- 
tonságós. 


Megjegyzés (1). Érdemes megvizsgálni a (vv) -R3(v) V A (t, v) részformulát a 
harmadik, kiegészítő feltétel tekintetében is. Mivel a részformula magja -ftz(ív)v 


... alakú, ezért kijelenthető, hogy a v kötött változó minden doménen kívüli 
értéke kielégíti a részformulát a t szabad változó minden lehetséges értéke mellett, 
így az előzővel összhangban a részformula biztonságos. 
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Megjegyzés (2). Fontos megfigyelés, hogy egy biztonságos kifejezés formulá. 
ját negálva nem biztonságos kifejezést kapunk. Az állítás visszafelé nem igaz, 
nem biztonságos kifejezés formuláját negálva nem feltétlenül kapunk biztonsá. 
gos kifejezést. Pl. a WV (0) z (01 a 2) formula esetén a (20 v (21 

kifejezés eredményhalmaza az A halmaz 2-nél kisebb, a (240 - (40)) kife- 


jezés a 2-nél nagyobb vagy egyenlő számait tartalmazza," vagyis egyik kifejezés 
sem korlátozott a DOM(W)-re, ezért egyik sem biztonságos. 


. Az A halmaz ismeretének hiányában ennél többet nem állíthatunk nz éredményhalmazról, 
az tartalmazhat például negatív vagy valós számokat is. 











Megjegyzés (3). A formulák biztonságosságának meghatározása és a formula 
kiértékelése két különböző dolog. Pl. egy (-$(t) A S2(t) formula biztonságos, 
hiszen csak 52-beli t helyettesítések tehetik igazzá. Tehát kí tehet véges idő, 
ill. véges (közbülső) eredményhalmazok mellett ís értékelni. Ugyanakkor ha egy 
egyszerű nutomata megpróbálná kiértékelni (balról jobbra), akkor -51(t) kiérté- 
kelése nagy valószínűséggel sikertelen lenne, emiatt a teljes formuláé is az lehet. 





Megjegyzés (4). Egy V biztonságos sorkalkulus kifejezés eredményhalmazát 
előállító egyszerű algoritmus az alábbi elven működhet. Ha a Y kifejezés biztonsá- 
gos, akkor az eredményhalmazban csak DOM ()-beli elemekből álló n-esek sze- 
repelhetnek. Áz első lépés tehát a DOM(Y) meghatározása a PF kifejezésben sze. 
replő alaprelációk és konstansok alapján. Ezután végigiterálhatunk a DOMÍV) 
elemeiből mint komponensekből képzett összes (a kifejezésnek megfelelő dimen- 
ziójú) v(N) n-csen, és megvizsgáljuk, hogy kielégíti-e a kifejezés formuláját: ha 
igen, megy az eredményhalmazba, különben folytatjuk a következő n-essel. 





A kvantoros részformulák ígazságértékét a következőképpen határozzuk meg. Meg- 
határozzuk a doménjét, majd az ebből képzett av(ím) m-eseken végigiterálunk, és 
ellenőrizzük, hogy a külső iteráció v(r) n-esére és a belső ciklus w(r) m-esére 
teljesül-e a belső formula minden (v) vagy legalább egy (3) iterációban. Több- 
szintű kvantálás esetén ezt rekurzívan ismételjük. 


Tétel. A relációs algebra és a biztonságos sorkalkulus kifejezőereje ekvivalens. 


Bizonyítás. 


Relációs algebra — biztonságos sorkalkulus 


Teljes indukcióval, az előző tétel alapján belátható. Csupán azt kell még 
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feltételezni, hogy az n-edik lépésben Ep 2 Ik z (69) $E z 


(6] Wa ép) még biztonságos kifejezések. Ezután megvizsgálandó, hogy 
az öt alopműveletre adhatók-e biztonságos kifejezések. 


Az előző tétel bizonyításánál alkalmazott jelölésekkel illusztrációképpen megmu- 
taljuk az unióval ekvivalens sorkalkulus kifejezés biztonságosságát. 


aj felvet) v. v2(t)) biztonságos, hat 


- Egyrészt Vi(t) v V2(t) csak olyan t-re igaz, amelyre ( € DOM(4) V Va). 
Ez pontosan akkor ignz, ha W1(t) és V2(t) bármelyike igaz. 
Mivel E) biztonságos, ezért ha Wy(z), akkor t € DOM (Vg), ill. mivel 
E) biztonságos, így t € DOMÍV2) ís teljesül, tehát t € DOM (1) U 
DOM (42). 
Azonban DOA(Wj) U DOM (Wo) z DOM(j vo), tehát beláttuk, 
hogy a V.(t) v. Valt)-t igazzá tevő t-kret € DOMÍVJ V o). 

- Másrészt E-nek esetleges kötött változói csak $y-ben vagy W2-ben lehet- 
nek, márpedig az ezekkel felépített E) és E kifejezések még biztonságosak, 
tehát a kötölt változók a biztonságosságot nem ronthatják el. 


A többi relációs algebrai alapműveletre a biztonságosság hasonlóképpen belátha- 
16. 


Biztonságos sorkalkulus 5 relációs algebra 


Nem bizonyítjuk. 





5.3.2. Relációs oszlopkalkulus (domain relational calculus) 


A relációs osztopkalkulus elsősorban abban különbözik a sorkalkulustól, hogy sor- 
fvektor-)változók helyett egyszerű változók szerepelnek benne. A tapasztalat szé- 
rint bizonyos lekérdezések egyszerűbben fogalmazhatók meg cbben az csetben. 
Az oszlopkalkulus felépítése, interpretációja n sorkalkuluséhoz igen hasonló, ezért 
csak a különbségeket mutatjuk be. 

Szimbólumait 


— oszlopváltozók: us, 


Az atomok felépítése: 


- RÉT) (gy, 2... m), ahol 21.22 - . .Tm konstansok vagy oszlopváltozók 
- 20 y, ahol z és y konstansok vagy oszlopváltozók és 8 aritmetikai relációjel 


A formulák felépítése: 


A kifejezések felépítése; 


(m1.72... :Tml Vízi T2. ..Tm)) a 


" ahol v olyan formula, amelynek szabad változói csak 71, 72,...2m. 
Példa. (Azonosak a sorkalkulus szakasz példáival.) 


- Az 1997. jan. 1. és az utána következő napok bevételei a dátummal együtt: 
(r.yI BEVÉTEL (y, z) Ay 2 19970100) 
- Az 1997. jan. 15-i bevétel és a befizetett összeg: 
(z.yi BEFIZ (x,y) A (32) BEVÉTEL (z, 7) A z s "19970115") 


- Hány darabot adtak el 1997. jan. 15-én az Al kódú áruból, mi a neve és az 
Ára? 
(xyz) (3u) (3v) MENNYISÉG (v, u, x) A 
A ÁRU (u,ysz) Av — 19970115"A u — AV) 


Példa (2). Fogalmazzuk meg oszlopkalkulussal az alábbi kifejezést: azokat a bol. 
tokat irigeeták ahol a boltban kapható maradek Lejdáták finom. A boltok listája 
a totiÚl M(bolt), a finom termékek listája a finom! termék) relációban, az egyes 
boltok kínálata a kapható (bolt, termék) relációban található. 


dolt bolt finom termék 
Alla Cukrászda dobostorta 
Lambda Cukrászda almás pite 
Szigma Cukrászda 





termék 

dobostorta 
almás pite 
fürészporos pogácsa 


kapható bolt 
Lambda Cukrászda 
Lambda Cukrászda 
Szigma Cukrászda 








A feladat szerint olyan boltokat keresünk, amelyekre igaz, hogy minden termékük 
szerepel a finom relációban. Egy tipikus hiba, hogy a lekérdezést az alábbi módon 
fogalmazzuk meg: 


(b [docAuthor a (ve) kapható?) (b, t) A finom) ; 
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Ezzel a lekérdezéssei ugyanis olyan b boltokat kercsünk, amelyekre igaz, hogy 
minden t termékkel a (b,2) pár eleme a kapható relációnak és a t termék eleme 
a Ánom relációnak. A minden kvantor miatt azonban a £ oszlopváltozó értéke 
tetszőleges értéket felvehet. Például / — , rémes krémes" esetén a finom re) a 
fenti relációk esetén - hamis, ezért a kvantor utáni formula értéke is hamis, Így a 
kifejezés eredményhalmaza üres lesz. 

Fontos, hogy a ,rémes krémes" terméknek nem kell sem a kapható, sem n finom 
relációban előfordulnia. Ennek oka, hogy a minden kvantor definíciója szerint 
(vit) ) y ÜST USE; fe se] pontosan akkor igaz, ha minden ult) e A(4) 
cselény (tten, ... ST) igaz, ahol A egy tetszőleges, véges, de nem 
korlátos, számítógépen ábrázolható számhalmaz. Fontos, hogy az A halmaz véges, 
de nem meghatározott méretű, ezért tetszőlegesen nagy lehet. Így az A halmazban 
biztosan szerepel a ,dobostorta", , almás pite" stb. mellett a , rémes krémes" ís. 


A kifejezést helyesen az alábbi módon fogalmazhatjuk meg:!§ 


(e [docAuthor] A (vu) kaphat£2) (b, u) — finom (u) h 


Azaz azokat a b boltokat kercssűk, amelyekre igaz, hogy ha egy t termék a b 
boltban kapható, akkor v finom is. A kalkulus kifejezések formális nyelvtanában 
nem szerepel az implikáció, ezért átírjuk úgy, hogy csak —, A, V logikai műveleteket 
használjon: 


(4 [docAUth] A (Vu) kapható) (b, u) v finom u) ) 


A kifejezés szerint az eredményhalmazba olyan boltok kerülnek, ahol minden ter. 
mékre igaz, hogy az adott boltban nem kapbató vagy finom - azoz minden ter- 
mékük finom. 





Tétel. Rögzített A interpretációs halmaz és RÉ) C A"k relációk esetén a 
sorkalkulus bármely kifejezéséhez létezik az oszlopkalkulusnak olyan kifejezése, 
amely az előzővel azonos relációt határoz meg. 


Bizonyítás. ( s ím) v (s) ekvivalens ízi s z25.sazm] ")-vel, hiszen sím) 


helyére 71, 72... ,tm-et írunk és §-ből Y-t úgy kapjuk, hogy RÉCE) helyére 
R(N (z1,x2,. . . ,$n)-t, ÚÉPP[i) helyére pedig xi-t (runk. 


Annak, hogy az oszlopkalkulus kifejezésekben z;-k pontosan megegyeznek va- 
lamely sorkalkulus kifejezés egyik sorváltozójának valamely komponensével, van 


egy további közvetlen következménye is: ha (s9] v (sm) ) ) biztonságos, akkor 


3 Az implikációt ld. részletesebben ez A. függelékben. 
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í ,! 
a neki megfelelő ÍTnT2e .. zmI 9 "9 is biztonságos lesz. Ezzet beláttuk, hogy a ! ; 
relációs algebra, a biztonságos sorkalkulus és a biztonságos oszlopkaikulus kife. ; Hi 
jezőerejüket tekintve ekvivalensek egymással. : 


] ! 





A kereskedelmi rendszerek konkrét lekérdező nyelvei ennél valamivel bővebbek, " 
tipikusan aritmetikával, aggregációval (aggregation) is kiégészítettek (képesek az 
aritmetikai alapműveleteken kívül átlag, szórás, minimum stb. képzésére is), to- 
vábbá támogatják a rekördök megváltoztatását, új rekordok bevitelét is. Amennyi. 
ben mindaz lekérdezhető velük, mint ami a megismert három ekvivalens kifejező 
erejű absztrakt nyelv közül bármelyikkel, akkor relőciósan teljesnek (relationally 
complete) nevezzük a lekérdező nyelvet. 


5.4. Az SOL nyelv! 


A relációs adatbázis-kezelőkkel történő kommunikáció manapság legelterjedtebb 
nyelve az ún, strukturált tekérdezőnyelv (Structurcd Ouery Language, SOL). 


5.4.1. Az SOL története . ! 


- Codd 1970-es cikkében! vezeti be a relációs adatmodelit az adatbáziskezelés  ; 
világába. 

- 1974-75-ben kezdték - a relációs adatmodellre alapozva - a kifejlesztését ez 
IBM-nél, az veredeti" neve SEGUEL (Structured English O0UEry Language). 

- 1979-től több cég (pl. IBM, Relational Software Inc., a mai Oracle Corp.) 
kereskedelmi forgalomban kapható termékeiben, 


— 1987-től ANSI szabvány. 


5.4.2. A nyelv jelentősége 
- Szabvány, amelyet jelenleg csaknem minden relációs adatbázis-kezelő alkal- ! 
maz (kisebb-nagyobb módosításokkal). ! 


- Tömör, felhasználó közeli nyelv, alkalmas hálózatokon adatbázis-kezelő szer- 
ver és kliensek közötti kommunikációra. 1 


- Nem-proccdurális programozási nyelv (legalábbis a lekérdezéseknélj. ; 
5.4.3. A példákban szereplő táblák 


A leírás az SOL nyelv Oracle , dialektusát" ismerteti, ez többé-kevésbé megfe- ! 
Jel az egyéb termékekben található nyelv variációknak. A nyelv termék- illetve 
hardverspecifikus elemeit nem, vagy csak futólag ismertetjük. 





Az utasítások ismertetésénél a következő táblákat használjuk. 


MA (4) irodalom alapján. 


5 Edgar F. Codd: A Relational Model of Data for Large Sharcd Data Banks, Communicatióts 
of the ACM, vol 13. No 7. (1970. június) 


seréssaátlt 
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DEPTNO Lac 
ACCOUNTING Í NEW VONRK 
20 RESEARCH DALLAS 
30 SALES CIHHCAGOÓ 
40 OPERATIONS DOSTON 












EXPNO 






















SMITA CLERK 

















7499 ALLEN SALESMAN 29-FEB-81 30 
7521 WARD SALESMAN 22-FEB-81 30 
7566 JONES MANAGER 02-APR-81 20 
7054 MARTIN ( SALESMAN 285EP.81 30 
1698 BLAKE MANAGER 01-MAY-81 30 
1182 CLARK MANAGER 09-JUN-61 14 
7786 SCOTT ANALYST 21-IUL-85 20 
7639 KING PRESIDENT 17-NOV-BI 10 
7844 ( TURNER ( SALESMAN 0£-.SEP-§g1 30 
7876 ADAMS CLERK 24-AUG.85 20 
7900 JAMES CLERK 03-DEC-81 30 
1902 FORD ANALYST 03-DEC-81 20 
7931 MILLER CLERK 23-JAN.82 JÓ 


5.2. táblázat. Ep tábla az alkalmazottak adatainak tárolására 


5.4.4. A nyelv definíciója 
A nyelvet a következő részínyelvjekre oszthatjuk; 


- adatdefiníciós nyelv (data definition language, DDL) 

- adatlekérdező és manipulációs nyelv (data manipulation language, DML) 

— egyes források a lekérdező nyelvet a DML-től különválasztják, ekkor külön 
résznyelvként megjelenik az ún. adatlekérdező nyelv (data aucry Innguage, 
DOL) 

- adatclérést vezérlő nyelv (data control language, DCL) 


A nyelvben - a szöveg líterálok kivételével - a kis- és nagybetűket nem különböz- 
tetjük meg. A megadott példáknál a könnyebb érthetőség miatt a nyelv alapszavait 
csupa nagybetűvel, míg a programozó saját neveit kisbetűvel írjuk. 


A parancsok több sorba ís átnyúlhatnak, a sorokra tördelésnek, és a tabulálásnak 
nincs szemantikai jelentősége. Az SOL parancsokat pontosvessző zárja le. 


5.4.4.1. Táblák, nézetek, indexek létrehozása, törlése 
Tábla létrehozása Új táblát a 


CREATE TABLE Ktáblanév? 
(coszlöpnév? ctípus: (NOT NULL) 
(, söszlopnév? ctípus: (NOT NULL], ...) 
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paranccsal lehet létrehozni, A lehetséges adattípusok implementációnként változ. 
hatnak, általában a következő adattípusok megtalálhatók: 


— CHAR(n), VARCHAR2(n) — max n karakter hosszú szöveg 

— LONG(n) - mint a CHAR, de hosszára általában nincs (vagy nagyon nagy a) felső 
korlát 

— NUMBER(v) - az előjel nélkül max. tv karakter széles egész szám; az Oracle 
INTEGER típusa megégyezik a NUMBER(30)-cal 

— XUHBER(v.4) — wa szám tízes számrendszerbeli helyi értékeinek a számát, míg 
textítd a pontosságot, szaz a tízedes vessző után álló helyi értékek számát 
jelenti 

- DATE -— dátum (és általában időpont). 


Ha valamely oszlop definíciója tartalmazza a NOT NULL módosítót, a megfelelő me- 
zőben mindig valamilyen megengedett, nem üres értéknek kel! szerepelnie. 


A felhasznált táblák definíciója a következő lehet: 


CREATE TABLE enmp ( 
empno NUMBER (4) NOT NULL, 
€nanö CHAR( 103 , 
job CHAR(9) , 
egr NUMBER(4) , 
hirodate DATE, 
sal NUMBER(7 , 2) , 
tosm NUMBER(7,2) , 
déeptno — NUMBER(2) NOT NULL 
); 


CREATE TABLE dopt ( 
deptnő NUMBEAR(2) NOT NULL, 
dnate  CHAR(t4), 
loc CHAR(13) 


5.4.4.1.1. Nézet létrehozása A nézetek olyan virtuális táblák, amelyek a f- 
zikai táblákat felhasználva a tárolt adatok más és más logikai modelljét, csopor: 
tosítását tükrözik. 


Nézetet a 


CREATE VIEW cnézetnév?i [(soszlopnévis, ,.,)) 
45 Clekérdezégi; 


paranccsal hozhatuk létre. A lekérdezésre az egyedüli megkötés, hogy rendezést 
nem tartalmazhat. Amennyiben nem adunk meg oszlopneveket, a nézet oszlopai 
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n SELECT után felsorolt oszlopok neveivel azonosak. Meg kell viszont adni nz ösze 
lopneveket, ha a SELECT számított értéket is előállít. Például: 


CREÁTE VIEY dept sal (deptno, avg.eslary) AS 
SELECT deptno, AVG(sal) 
FROM emp 
GROUP BY deptno; 


A nézetek a lekérdezésekben a táblákkal megegyező módon használhatók. Jelen- 
tőségük, hogy az adatok más modelljét fejezik ki, felhasználhatók a tárolt infor. 
máció részeinek elrejtésére, pl. különböző felhasználók más-más nézeteken kercsz- 
tül szemlélhetik az adatokat. A nézet általában csak olvasható, az adatmódosító 
műveletekben csak akkor szerepelbet, hagy egyetlen táblából keletkezett és nem 
tartalmaz számított értékeket. 


5.4.4.1.2. Index létrehozása Az indexek a táblákban történő keresést gyor- 
síthatják meg. Létrehozásuk: 


CREATE (UNIGVE) INDEX cCindexnévy 
ON ctáblanév?: (coszlopnévi2, ...); 


Az indexeket az adatbázis-kezelő a táblák minden módosításánál frissíti. Amennyíi- 
ben valamelyik indexet a WIgyE kulcsszóval definiáltuk, a rendszer biztosítja, hogy 
az adott oszlopban minden mező egyedi értéket tartalmaz. Lehetőség van több 
oszlopot egybefogó, kornbinált indexek létrehozásárn. 


A lekérdezésekben nem jelenik meg, hogy a táblához tartozik-e Index. Az indexek 
a létrehozásuk után n felhasználó számára láthatatlnnok, csak éppen bizonyos 
lekérdezéseket gyorsítanak. Indexeket azókra ez oszlopokra érdemes definiálni, 
amelyek gyakran szerepelnek keresésekben. Index nélkül minden kéréshez be kell 
olvasni az egész táblát. Szerencsés esetben viszont az adottáblában egyáltalán nem 
kell keresni, a kívánt rekord csupán az index alapján közvetlenül ís kiválasztható. 
Ha a keresési feltételhez van megfelelő index, akkor az adatbázis-kezelő a diszkről 
csak a valóban szükséges adatokat olvassa be. 


Pl. a 


SELECT 
FROK ezp 
WHERE epame s "JONES"; 


az emp táblában keresés nélkül kiválaszthatja JONES rekordját, ha az aname oszlopra 
definiáltunk indexet, 
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5.4.4.1.3. Törlések A fenti adatbázis objektumokat a DROP paranccsal) lebel 
törölni, 


DROP [TABLE I VIEW I INDEX] cnév:; 


5.4.4.2. Tábla definíciók módosítása 


Már létező táblákat módosítani az 


ALTÉR TABLE Ktáblanév: 
(ADD ) MODIFY] toszlopnév? Ktípus?; 


paranccsal lehet, ahol ADO egy új, WULL értékű oszlopot illeszt a táblához, míg a 
KODIFY paranccsal egy létező oszlop szélességét növelhejük. 


5.4.4.3. Adatok bevitele, törlése, módosítása 


" 5.4.4.3.1. Adatok bevitele Á CREATE TABLE utasítással létrehozott táblák kez 
detben üresek. 


Új soroknt egy meglévő táblába az 


INSERT INTÓ ctáblanóv? ((cosziopnév: (, toszlopnév:, ...1)) 
VALUES (ckífi2 (. ckif22, ...]); 


illetve az 


IXSERT INTO ctáblanévi [(coszlopnév:, ...)] 
CSELECT ...55 


utasításokkal lehetséges. Míg az első szerkezet egyetlen sort, addig a második a 
lekérdezés által előállított összes sort beilleszti. (Figyelem: a táblákban az egyes 
rekordok sorrendje nem definiált, így a beillesztés sem feltétlenül a tábla , végére" 
történik.) 

Amennyiben nem adjuk meg az oszlopok nevét, akkor a - tábla deklarálásánál 
megadott sorrendben - minden mezőnek értéket kell adni, ha viszont megadtuk az 
egyes oszlopok neveit, akkor csak azoknak adunk értéket, mégpedig a felsorolásuk 
sorrendjében, a többi mező NuLL értékű lesz. 


Az egyes mezőknek Wu. értéket is adhatunk, ha a deklaráció alapján az adott 
mezőnek lehet NunL értéke. 


Figyelem. Amennyiben olyan oszlopnak akarunk WuLL értéket adni, amelynek nem 
lehet wit értéke, úgy a parancsvégrehajtás hibával leáll! 


Egy ilyen paranccsal egyszerre csak egy sort tudunk felvenni a táblába. 
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Két új termék bevitele pl. az alábbi SOL utasítással lehetséges: 


INSERT INTO product (prodid, descríp) 
VALUES (111111, "Gozeke"9; 


INSERT INTO product 
VALUES (111212, "Oracia 6.0", NULL, "Aelacios adatbazia-kezelot); 


5.4.4.3.2. Adatok törlése Sorokat kitörölni a 


DELETE 
FAOH ctáblanév: 
(WHERE clogikat kifejezés]; 


paranccsal lehet. 


Ha a WERE hiányzik, akkor a tábla valamennyi sorát, egyébként csak n logikai 
kifejezés által kiválasztott sorokat törli. 


Ha az előzőekben felvett adatok közül a 111112 azonosítójút (prodid) törölni akar- 
juk, akkor ezt a következő módon lehetséges: 


DELETE 
FROH product 
WHERE prodid 5 111112; 


5.4.4.3.3. Adatok módosítása Sorokban az egyes mezők értékeit oz 


UPDATE ftáblanév? 
SET töszlöpnév? s ckifejezés; (, coszlopnáv? v cxifejszéez, ...) 
(WHERE clógíkai kifejezési); 


paranccsal lehet módosítani, 


Ha a WKERE hiányzik, akkor a parancs a tábla valamennyi sorában módosít, egyéb- 
ként csak a logikai kifejezés által kiválasztott sorokban. 


Ha a PRODUCT táblában a "Gozeke"-hez megjegyzést akarunk fűzni, akkor ezi 
a következőképpen lehet megoldani: 


UPDATE product 
SET comments s "mezogazdasagi gép" 
WHERE descríp " "Gozoka!; 
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5.4.4.4. Lekérdezések 


A lekérdezések általános szintaxisa a következő: 


SELECT £jellemzökz 

FROK czáblák: 
(WHERE clogikai kifejezés?) 
fecsoportosításo) 
[erendszéső] ; 


A lekérdezés művelete eredményül egy újabb táblát állít elő -— persze lehet, hogy 
az eredmény táblának csak egy oszlopa és csak (nulla vagy) egy sora lesz. Az 
eredmény tábla a lekérdezés után megjelenik vagy a tábla felhasználható egy másik 
parancsba beágyazva (pl. halmazműveletek). 


- A cjellemzők; definiálják az eredmény tábla oszlopait, 
a ctáblák; adják meg a lekérdezésben résztvevő táblák nevét, 


— a cogikai kifejezés; segítségével szűrhetünk (, válogathatunk") a bemenet 
sorai között, 


- A ccsoportosítás; a szűrt bemenet sorait rendezi csoporokba úgy, hogy az 
eredménytáblában csoportonként pontosan egy rekord szerepel. A képzett 
csoportok között opcionálisan egy logikai kifejezéssel szűrhetünk (,válogat- 
hatunk") is, 


— a trendezés? az eredménysorok sorrendjét határozza meg. 


Nézzük meg, hogy a lekérdezés műveletével hogyan lehet megvalósítani a relációs 
algebra alapműveleteit. 


5.4.4.4,1. Vetítés (projckció, projection) A vetítés művelete egy táblából 
adott oszlopokat válogat ki. A czjolleazök; között kell felsorolni azokat az öszlo- 
pokat, amclyekre a ctáblanév: által meghatározott táblát vetíteni akarjuk. 


SELECT jellemzök? 
FROH ctáblanév2; 


Például az alkalmazottak neve és fizetése; 


SELECT enane, sal 
FROM emp; 


Minden oszlop kiválasztása: 


SELECT , 
FROM ezp; 
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Ha a cjetleszök?-ben csak a v-ot adjuk meg, akkor az adott tábla minden oszlopát 
kiválasztja. (Az egész táblát megjeleníti.) 


A cjellenzöky közé nem csak a FROH mögött megadott tábla oszlopninak nevét 
lehet megadni, hanem használhatjuk az SOL beépített műveleteit, pl. egyszerű 
aritmetikai kifejezéseket új érték előállítására, oszlopfüggvényeket (lásd később). 


A dolgozók egész éves fizetése; 


SELECT enane, 12 s: sal 
FROM emp; 


Amennyiben a dolgozó által kézhez kapott teljes összeget - fizetést és prémiumot - 
együtt akarjuk megkapni, hasonlóan járhatunk el. Az jelent csak problémát, hogy 
a comn érték nincs mindenhol kítöltve, az üres mezőket nem tudjuk hozzáadni a 
fizetéshez (az üres nem 0)! Ilyenkor használhatjuk az NyL(oszlop, érték) függvényt, 
amely az üres (WuLL) mező helyett a megadott értéket adja vissza. 


A dolgozó által felvett pénz: 


SELECT enome, sal § NYL(comm, 0) 
FROH ezp; 


A kiválasztott osztopokat tartolmazó táblákban lehetnek azonos sorok, ami ellent- 
mond a relációs táblák egyik alapvető követelményének. Ennek ellenére a SELECT 
utasítás nem szűri ki automatikusan az azonos sorokat, mert ez túlságosan időigé- 
nyes művelet. A programozónak kel) tudnia, hogy az előállított táblában lehetnek- 
e (zavarnak-e) ilyen sorok. Ia kell, a következőképpen szüűrhetjük ki ezeket í(való- 
jában ez felel meg a relációs algebra vetítés (projection) műveletének): 


Az összes különböző munka megnevezése: 


SELECT DISTINCT job 
FROH epp; 


5.4.4.4.2. Szelekció (selection) A kiválasztás műveleténél a tábla sorai közül 
válogatunk. A ciogikai kifejezés: igaz értékeinek megfelelő sorok kerülnek be az 
eredmény táblába. 


SELECT cjellemzők? 
FROH ctáblanáv: 
WHERE (1l0ógikai kiífejezásy; 


A 20900 dollárnál magasabb fizetésű dolgozók: 
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SELECT ébpate, sal 
FROH ecp 
WHERE sal 3 2000; 


Vizsgáljuk meg a logikai kifejezések szerkezetét. A kifejezések elemi összetevői: 


- literálok különböző típusú értékekre: számok, szöveg, dátum (a dátumliterál 
formája: DATE"6646-hh-nn" , ahol 466 az évszárn 4 számjegyen, hh és an pedíg 
rendre a hónap és a nap két számjegyen, ha kell, vezető nullával) 
- oszlopok nevei 
— a fenti elemekből elemi adatműveletekkel képzett kifejezések 
o számoknál: aritmetikai műveletek, aritmetikai függvények 
o szövegeknél; SUBSTR(), INSTR(), UPPERC(), LOWER() , SOUNDEK( , ... 
o dátumoknál: -4-, —, konverziók 

- halmazok: pl.: C10.20.30) 


- zárójelek között egy teljes SELECT utasítás (egymásba ágyazott lekérdezések, 
ld. később). 


A fenti műveletekkel képzett adatokból logikai értéket a következő műveletekkel 
állíthatunk elő; 


relációk: c, ca, s, ta, 39, 2 

intervallumba tartozás: BETVEEN . AND . 

NULL érték vizsgálat: IS NULL, IS NOT NULL 

halmaz eleme: IN cbalmaz? 

szöveg vizsgálat: mintával összevetés . LIKE cninta), ahol 
o X a tetszőleges karaktersorozat jelzése 
o . a tetszöleges karakter jelzése. 


Végül a logikai értékeket a zárójelezéssel illetve az AND, OR és Hor műveletekkel lehet 
tovább kombinálni. Példák: 


— A 82...89-cs években felvett dolgozók: 
SELECT oname, hiredate 
FROM eunp 
WHERE hírodate BETWEEN DATE"1982-01-01" AND DATE"1989-12-31"; 
- A 2000 dollárnál kevesebbet kereső és prémiumot nem kapó dolgozók: 
SELECT enape, 6al 
FROM emp 


WHERE gal £ 2000 
AND comm IS NULL; 
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5.4.4.4.3. Illesztés (join) A természetes illesztés műveleténél két vagy több 
tábla soraiból hozunk össze egy-egy új rekordot akkor, ha a két sor azonos nevű 
mezőinek értéke megegyezik. A sELEcT kifejezésben a ctábláks-ban kell megadni 
az érintett táblák neveit vesszővel elválasztva, A WHERE mögötti logikai kifejezés 
definiálja azokat az oszlopokat és feltételeket, amely értékei szerint történik meg 
az illesztés. Vegyük észre, hogy ez a megoldás valójában a - természetes illesztésnél 
általánosabb - 8-illesztést (5.2.7. alszakasz) valósítja meg. 


Az egyes osztályok neve, székhelye és a hozzájuk tartozó dolgozók; 


SELECT dapt.dnama, dept.l0c, emp.enane 
FRÓN dept, emp 
WHERE dept.deéptno " ewp.deptno; 


Látható, hogy mive) mindkét felhasznált táblában azonos az illesztést megvalósító 
oszlop neve, a WHEAE-t követő logikai kifejezésben az oszlop neve mellé meg kel) adni 
a tábla nevét ís. Hasonló helyzet előfordulhat a SELECT-et követő cjelleazöx: között 
ís. 


Ha megvizsgáljuk a fenti példában kapott eredményt, láthatjuk, hogy a 40-cs 
osztály nem szerepel a listában. Ennek az az oka, hogy az osztálynak nincs egyetlen 
dolgozója sem, tehát az illesztésnél nem találtunk az eep táblában egyetlen olyan 
sort sem, amelyet ehhez az osztályhoz kapcsolhattunk volna. Ez lehet kívánatos 
eredmény, azonban az SOL-ben lehetőség van arra is, hogy ezeket a sorokat is 
illesszünk, azaz az összekapcsolás során az emp táblához hozzáillesztünk egy ürcs 
sort is. Ez az illesztési típus a külső iltesztés (outer join). A módosított példa n 
következőképpen néz ki: 


SELECT depr.dnane, dept.1loc, emp.oname 
FROM dept, omp 
WHERE dept.doptno " emp.deptno (e); 


A £6) jel jelzi azt a táblát amelyikben ha nincs n másik táblához illeszkedő sor, ak- 
kor egy űres mezőket tartalmazó sort kell hozzávenni. Az illesztésnél lehet ugyan- 
árra a táblára többször ís hivatkozni. Pl.: 


Azon dolgozók, akik többet keresnek a fönöküknél: 


SELECT 6.énamé, 0.tal, n.€name, m.9al 
FROH amp a, emp a 

WHERE e.ngr " m.empno 
AND 9.321 ? p.8al; 


A fenti példában ugyanazt a táblát kétszer is használjuk, a két tábla oszlopainak 
megkülönböztetésére a táblákat a Faok részben lokális névvel látjuk el. Lokális 
neveket természetesen különböző táblák esetén ís használhatunk. 
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Látható, hogy az illesztés mellett egyidejűleg más logikai kifejezéseket is hasz 
nálhatunk. Á fizetések fenti vizsgálatát felfoghatjuk úgy is, mint a természetes 
illesztés műveletének általánosított esetét (Id. 8-illesztés, 5.2.7. alszakasz), ahol 
nem csak az egyenlőség művelete használható, valamint úgy is, hogy a már egye. 
sített táblából zárjuk ki a fizetésekre szabott követelményeknek meg nem felelő 
sorokat. 


Az SOL programozó számára átlátszó, hogyan (milyen algoritmusokkal) hajtódik 
végre a megírt lekérdezés.!ő Itt fedezhető fel a nyelv eredmény-orientált (dekla. 
ratív, a ,mit számítsunk ki" kérdésre fókuszáló) jellege, szemben az algoritmus: 
orientált (imperatív) nyelvekkel, amelyek a ,hogyan szárnítsuk ki" kérdésre fó- 
kuszálnak. 


5.4.4.4.4. Oszlopfüggvények (aggregáció, aggregation) A lekérdezés 
eredményeként előálló táblák egyes oszlopaiban lévő értékeken végrehajthatunk 
- a procedurális nyelveken tipikusan — ciklussal ciklusokkal kifejezhető művelete 
ket, amelyek egyetlen értéket állítanak elő. Ilyenek: 


AYGO átlag 

SUWHO összeg 

COUNTO darabszám 
MAI() maximális érték 
HIN() minimális érték 


Az üzletkötők átlagfizetése: 


SELECT AVG(eal) 
FROK ecp 
VHERE job e "SÁALESHAN! ; 


Hány dolgozó van: 


SELEGT COUNT(P) 
FROM enp:; 


Hány különböző beosztás van: 


SELECT COUNT(DISTINCT job) 
FAON epp; 


1 Ez gyakran előny - hiszen a fejlesztést hatékonyabbá tudja tenni, a programkód hamarabb 
elkészül. Azonban komplex, hosszan futó lekérdezéseknél — ahol egyáltalán nem biztos, hogy 
a lekérdezés optimaljizáló (ld. 6. fejezet) valóban a legjobb végrehajtási tervet állítja elő - 
fontos lehet, hogy a fejlesztő ís tisztában legyen azzal, hogy hogyan kajtódik végre a lekérde 
zése.Ekkor a programozónak - az SOL impkmeantációtól függő módon, tipikusan — lehetősége 
van a végrehajtási tervbe beavatkozni, amit , hintelésnek" nevezünk. 
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Átlagos prémium: 


SELECT AVG(NYL(corm, 03) 
FAOM enp; 


Figyelem: az utolsó példa az WVL függvényt használva az összes dolgozóra átlagolja 
a kifizetett prémiumot, míg mu nélkül csak azokra átlagolná, akik kaptak egy- 
általán prémiumot. (Az oszlopfüggvények kiszámításánál a NuLL értékű rekordok 
kimaradnak, kivétel ezalól a COUNT(s), ami minden rekordot számol.) 


Mivel az oszlopíüggvény eredménye egyetlen értéket állít elő, az eredménytábla 
oszlopainak definiálásakor az oszlopfüggvény mellé vagy más oszlopfüggvényeket 
írhatunk, vagy olyan értéket írhatunk, amelyik az összes kiválasztott sorban nzo- 
nos. Ha nem oszlopfüggvény eredményéből (és nem könstansból) származó érték 
is része a2 eredménytáblának, akkor csoportosítani kell ezen értéklista szerint. A 
csoportosítás szükséges akkor is, ha a programozó biztos benne, hogy az összes 
kiválasztott sorban azonosak az értékek. Például írhatnánk: 


SELECT COUNT("), AVG(6a1) 
FROM epp; 


De hibás az alábbi: 


SELECT job, AVG(6al) 
FROM epp 

WERE job e "SALESMAN"; 

SELECT COUNT(e), enamne 
FROM pp; 


5.4,4.5. Egymásba ágyazott lekérdezések 


Á WHERE mögött álló logikai kifejezésben, ílletve a FROM mögött álló tábla- 
megadásban állhat egy teljes SELECT utasítág is zárójelek között. Például: 


A nem New Yorkban dolgozók listája: 


SELECT ename 
FROM 6Dp 
WHERE deptno IN 
(SELECT deptno FRÜM dept WHERE loc Is "NEW YORK"); 


Azaz először kiválasztjuk azon osztályok azonosítóját, amelyek nem New Yorkban 
vannak, majd azt vizsgáljuk, hogy az ezekből képzett halmazban található-e az 
adott dolgozó osztályának azonosítója. Mellesleg ugyanezt a listát megkaphatnánk 
az illesztés műveletével is: 
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SELECT enama 
FROK dept, emp 

VEERE dept.deptna s amp.deptno 
AND dept.1oc 47 "NEY YORK"; 


A beágyazott lekérdezés vagy egyetlen értéket - azért mert egyetlen megfelelő 
sor egyetlen oszlopát választottuk ki illetve ösztopfüggvényt használtunk -, vagy 
több értéket - több sort - állít elő. Az előbbi esetben a SELECT értékét az elemi 
értékekkel azonos módon használhatjuk. Több érték egy halmazt jelent, tehát a 
halmazműveleteket használhatjuk. A korábban megismert INC - eleme — művelet 
mellett használható az ANY) illetve az attC) művelet, ahol a kívánt reláció a halmaz 
legalább egy, illetve minden elemére igaz. 


Legmagasabb fizetésű dolgozók (lehet, hogy több van?): 


SELECT enamo, 6al 
FROM emp 
WHERE sal 32 ALL (SELECT sal FAOM eap); 


Illetve ugyanez a példa oszlopfüggvény felhasználásával: 


SELECT oname, enl 
FROM émp 
VHERE sal e (SELECT HáX(sal) FROH amp); 


5.4.4.5.1. Csoportosítás (grouping) Az oszlopílüggvények a teljes kiválasz- 
tott táblára - minden sorra -— lefutnak. Gyakran célszerű lenne a kiválasztott 
sorokat valamilyen szempont szerint csoportosítani és az oszloplüggvényeket az 
egész tábla helyett ezekre a csoportokra alkalmazni. 


Foglalkozásonkénti átlagfizetés; 


SELECT job, AYG(aal) 
FROM e0p 
GROUP BY job; 


A fenti parancs az emp tábla sorait a job oszlop azonos értékei alapján csopor- 
tosítja. Természetesen az öszlopfüggvények korábbi használatához hasonlóan a 
SELEGT cjellemnző3-k között csak a csoportosítás alapját képező oszlop neve, illet- 
ve a csoportokra alkalmazott oszlopfüggvények, konstansok és az ezekből képzett 
kifejezések szerepelhetnek. 


A csoportosítás után az eredményből bizonyos csoportok kihagyhatók a RAVING 
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ú Cogikat kifejezés utasításrész használatával. A klogikai kifejezés: igaz értékei. 
nek megfelelő csoportokhoz tartozó 1-1 rekord kerül be az eredmény táblába. 


Foglalkozásonkénti átlagfizetés az 1000 és 3000 doltár közötti tartományban: 


SELECT job, AVG(asal) 
FAON enp 

GROUP BY job 

HAVIRG AVG(sal) BETVEEN 1000 AND 3000; 


A HAVING mögötti logikai kifejezésben természetesen csak egy-egy csoport közös 
jellemzőire vonatkozó értékek — a csoportosítás alapját képező oszlop értéke, vagy 
oszlopfüggvények eredménye - szerepelhetnek. Természetesen a csoportosítás előtt 
a WERE feltételek használhatók. Célszerű - gyorsabb — WHERE feltételeket használni 
mindenbol, ahol csak lehet, és a HavING szerkezetet csak akkor alkalmazni, amikor 
a teljes csoporttól függő értékeket akarjuk vizsgálni. 


5.4.4.5.2. Rendezés (sorting) Az eddig tárgyalt lekérdezések eredményében 
a sorok , véletlenszerű" - a programozó által nem megadható — sorrendben sze- 
repeltek. A sorrendet az ORDER BY által megadott rendezéssel lehet szabályozni. A 
rendezés több oszlop szerint is történhet, ilyenkor az először megadott oszlop sze- 
rint rendezünk, majd az itt álló azonos értékek esetében használjuk a következőnek 
megadott oszlop(ok) értékét. Minden egyes oszlop esetében külön meg lehet adni 
a rendezés ,irányát", amely alapcsetben emelkedő (asc), de a DESc módosítóval 
csökkenő rendezés írható elő. 


A 30-as osztály dolgozói munkakör neve szerint emelkedő, azon belül fizetés szerint 
csökkenő sorrendben: 


SELECT " 

FROM enp 

WHERE deptno a 30 
ORDER BY job, sal DESC; 


Osztályok szerinti átlagfizetés növekvő sorrendben: 


SELECT deptno, AVG(sal) 
FROH emp 

GROUP BY deptno 

ORDER BY AVG(sal); 


5.4.4.5.3. Egyéb, nem részletezett műveletek Áz egyes lekérdezések által 
előállított táblák halmazként is felfoghatók, az SOL nyelv ezen táblák kombiná- 
lására tartalmazza a szokásos halmazműveleteket is. 
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VHIÓN egyesítés 
INTERSECT  metszetképzés 
HINUS különbségképzés 
A műveleteket két szrecr utasítás közé kell írni. 


Rcelációs táblák segítségével le tudunk írni hierarchikus kapcsolatokat a különbőző 
sorok között. Például az emp táblában az eppno és az mgr oszlopok értékei alapján 
meg lehet konstruálni a vállalati hierarchiát. Erre a CONNECT BY PRIOR szerkczet 
szolgál. 


Például a 


SELECT aname, enpno, job, deptno, egr 
FRON épp 

CONNECT BY PRIOR emppó " ngr 
START WITH enamó " "KING" 
ORDER BY deptno; 


utasítás kiírja a dolgozók , fáját" a KING nevű elnöktől kezdődően, 


A CONNECT BY klózban megadott feltételt kielégítő rekordpárok a hierarchiában 
szülő-gyerek viszonyban vannak. A PRIOR kulcsszóval jelölt kifejezés a szülő rekor- 
don értelmezett. 


Nem tartoznak szorosan az SOL nyelvhez, de a legtöbb rendszer tartalmaz uta- 
sításokat, amelyekkel a lekérdezések által előállított táblázatok megjelenését - pl. 
az oszlopok neveit, szélességét, adatformátumát, illesztését, tördelését — definiál- 
hatjuk. 


5.4.4.6. Adatelérések szabályozása 


Az adatbázis-kezelő rendszereket tipikusan több felhasználó használja, ezzel kap- 
csolatban újabb feladatok merülnek fel. 


5.4.4.6.1. Jogosultságok definiálása Az egyes felhasználók részint az 
adatbázis-kezelő rendszerrel, részint az egyes objektemaival különböző művele- 
teket végezhetnek. Ezeknek a megadására szolgálnak a GRANT, megvonására pedig 
a REVOKE utasítások, amelyek az SOL adatelérést vezérlő nyelv részei, A 


GRANT (DBA I CÜNNEGT ! RESOURCES) 
TO cfelhásználó2, ... 
IDENTIFIED BY cjelszós, ...; 


REVOKE [DBA I! CONNECT ! RESOURCES] 
FROM -felhasználó?, ...; 
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parancsok az egyes felhasználóknak az adatbázishoz való hozzáférési jogát sza- 
bályozzák. A DB4 jogosultság az adatbázis adminisztrátorokat (DotalBasc Admi- 
nistrator) definiálja, akiknek korlátlan jogai vannak az összes adatbázis objektum 
felett, nem csak létrehozhatja, módosíthatja illetve törölheti, de befolyásolhatja az 
objektumok tárolásával, hozzáférésével kapcsolatos paramétereket is. Á RESOURCE 
jogosultsággal rendelkező felhasználók létrehozhatnak, módosíthatnak ill. töröl- 
hetnek új objektumokat, míg a CONNECT jogosultság csak az adatbázis-kezelőbe 
történő belépésre jogosít. 


Az egyes objektumokhoz - táblák ill. nézetek — a hozzáférést a 


GRANT cjogogsultaág?, ..,. 
ON ctábla vagy nézetnév? 
TO cfolhasználó? 

(VITH CRAXT OPTION] ; 


RÉVOKE kjogosultság?, ... 
ON ctábla vagy nézetnév? 
FRÓH cfelhasználóo; 


parancsok határozzák meg. A cjogosultági; az objektumon végezhető műveleteket 
adja meg, lehetséges értékei: 


ALL 
SELECT 
INSERT 
VPDATE 
DELETE 
ALTER 
INUEK 


Az utolsó két művelet nézetekre nem alkalmazható. A felhasználó neve helyett 
PUBLIC is megadható, amely bármelyik felhasználóra vonatkozik. A WITH GAANT 
OPTI0x-nal megkapott jogosultságokat a felhasználók tovább is adhatják. 


5.4.4.6.2. Tranzakciók Az adatbázisok módosítása általában nem történhet 
meg egyetlen lépésben, hiszen legtöbbször egy módosítás során több táblában tá- 
rolt információn is változtatni akarunk, illetve egyszerre több rekordban akarunk 
módosítani, több rekordot akarunk beilleszteni. Előfordulhat, hogy módosítás köz- 
ben meggondoljuk magunkat, vagy ami még súlyosabb következményekkel jár, 
hogy az adatbázis-kezelő leáll. Ilyenkor a tárolt adatok inkonzisztens!" állapot- 
ba kerülhetnének, hiszen egyes módosításokat már elvégeztünk, ehhez szorosan 
hozzátartozó másokat viszont még nem. 


! Ld. ACID tulajdonságok, a 10.1. szaknsz. 
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A tranzakció (transaction) az adatbázis módosításainak olyan sorozata, amelyet 
vagy teljes egészében kell végrehajtani, vagy egyetlen lépését sern. Az adatbázis. 
kezelők biztosítják, hogy mindíg vissza lehessen térni az utolsó teljes egészében 
végrehajtott tranzakció utáni állapothoz. 


Egy folyamatban lévő tranzakciót vagy a COMMIT utasítással zárhatjuk le, amely a 
korábbi cOMMIT óta végrehajtott összes módosítást véglegesíti, vagy a ROLLBACK uta- 
sítással törölhetjük a hatásukat, visszatérve a megelőző COMMIT kiadásakor érvényes . 
állapotba. 


Beállítható, hogy bizonyos műveletek automatikusan COMMIT műveletet hajtsanak 
végre: 


SET AUTOCOMHIT [IMK I OFF]; 


azonban az oFF állapotban ís commit-olnak az ALTEA, CREXTE, DROP, GRANT éS EXIT 
utasítások! 8, 


A rendszer hardver hiba utáni újraindulásakor automatikusan RÓLLBACK-et hajt 
végre. 


5.4.4.6.3. Párhuzamos hozzáférések szabályozása Az adatbázist több fel- 
használó akár egyidejüleg ís használhatja. Ennek speciális problémáiról Id. a 10. fe- 
jezetet. Ilyenkor az egyes táblákhoz a párhuzamos hozzáférést külön-külön lehet 
szabályozni. 


LOCK TARLE ctáblantvi, ... 
IN (SHARE ) SHARED UPDATE ( EXCLUSIVE) HODÉ [NOWAIT); 


A Lock paranccsal egy felhasználó megadhatja, hogy az egyes táblákhoz más 
felhasználóknak milyen egyidejű hozzáférést engedélyez. Az utasítás végrehaj- 
tásánál a rendszer ellenőrzi, hogy a Lock utasításban ígényelt felhasználási mód 
kompatibilis-e a táblára érvényben lévő kizárással. Amennyiben megfelelő, az uta- 
sítás visszatér és egyéb utasításokat lehet kiadni. Ha az igényelt kizárás nem enge- 
délyezett, az utasítás várakozik amíg az érvényes kizárást megszüntetik, ha csak 
a parancs nem tartalmazza a NOYAIT módosítót. Ebben az esetben a LOCK utasítás 
mindig azonnal visszatér, de visszaadhat hibajelzést is. 


A táblához hozzáférést az első sikeres Lock utasítás definiálja. 


A SHARE módban megnyitott táblákat mások olvashatják, a SHARE UPDATE módban 
mások módosíthatják is, ilyenkor automatikusan kölcsönös kizárás teljesül egy-egy 
sorhoz hozzáférésnél. Áz EXCLUSIVE mód kizárólagos hozzáférést biztosít. 


18 Az Oracle DBMS motorjában igazából nincs ís autocommit mód, a set autocommit on (vagy 


imm) a kliens viselkedését vezérli, ha az ért, és az fogja kiadni a commit-ot. Pl. az SOL"Plus 
nevű kliens érti. 
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5.4.5. Bővítések 
5.4.5.1. Konzisztencia feltételek, kényszerek 


A táblák definíciójánál eddíg csak azt adhattuk meg, hogy milyen adattípusbn 
tartozó értékeket lehet az egyes oszlopokban használni, illetve mely oszlopokban 
kell feltétlenül értéknek szerepelnie. Célszerű lenne a táblákhoz olyan feltételeket 
rendelni, amelyek szigorúbb feltételeket definiálnak az egyes adatokra, amelyeket 
azután a rendszer a tábla minden módosításánál ellenőriz. Hyenek például: 


- az egyes adatok értékkészletének az általános adattípusnál pontosabb deR- 
níciója (pl. adott intervallumba tartozás, adott halmazba tartozás, ahol a 
halmaz lehet egy másik tábla egyik osztopának értékei, vagy adott maszkra 
illeszkedés); 

— az oszlop elsődleges kulcs, azaz a tábla soraiban minden értéke különböző 
(hasonló hatás elérhető a wigye index-szel is); 

- az oszlop idegen kulcs, azaz értéke meg kell, hogy egyezzen egy másik tábla 
elsődleges kulcs vagy WIgvE index alapjául szolgáló oszlopának valamelyik 
létező elemével; 


Amennyiben a táblák módosításánál valamelyik feltételt megsértenénk, a rendszer 
egy kivételt (exception) generál, és lefuttatja a kivételhez tartozó kiszolgáló kódot, 
ha van ilyen. 


5.5. A fejezet új fogalmai 


halmaz, domén, reláció, attribútum, n-es (tuple, rekord), reláció fokszáma, relá- 
ció elemszárna, attribútum kardinalítása, relációs séma, relációs algebra, relációs 
algebrai alapműveletek (unió, különbség, keresztszorzat, vetítés, kiválasztás), szár- 
maztatott műveletek (metszet, természetes illesztés, theta illesztés, külső (jobb- és 
baloldali) illesztés), relációs algebra zártsága, relációs lekérdező nyelv teljessége, 
sorkálkulus, oszlopkalkulus, formális nyelv, megengedett szimbólum, atom v. ato- 
mi formula, formula, kötött/szabad változó, sorfosztopkalkulus kifejezés, formális 
nyelv interpretációja (értelmezése), interpretációs halmaz, igazságértékek hozzá- 
rendelése, formula doménje, biztonságos formula, lekérdező nyelv kifejezőereje 
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6. fejezet 


Relációs lekérdezések 
optimalizálása 


A fejezet anyaga a , relációs lekérdezések feldolgozása és optimalizálása" gazdag 
témakörének csak egy viszonylag kis, de alapvető részét fedi le. Nem foglalkozunk 
a lekérdezés fordításával és szintaktikai ellenőrzésével, a dinamikus programozás 


alkalmazásával, adaptív technikákkal és még számos más kapcsolódó problémával 
sem. 


6.1. Áttekintés 


A lekérdezés feldolgozás elsődleges célja az adatok adatbázisból való kinyerése. Az 
egyértelműen, de deklaratívan megfogalmazott célhoz vezető megoldás megtalálá- 
sa azonban korántsem egyszerű. Számos bonyolult részfeladatot kell az adatbázis- 
kezelő rendszernek megoldania, amíg eljut a kívánt végeredményhez. Ezek a kö- 
vetkezők, melyeket az a 6.1. ábrán ís szemléltetünk: 


1. Elemzés (szintaktikus), fordítás 
2. Költségoptimalizálás 
3. Kiértékelés 


Az első lépés a szintaktikai elemzés és a fordítás. Egy magas szintű nyelven (tipi- 
kusan az SOL valamilyen dialektusában) megfogalmazott kérést a számítógép szá- 
mára használhatóbb formára kell hozni. áz SOL-t, mint kommunikációs interfészt 
az emberi igényekhez tervezték: minden SOL mondat megfeleltethető egy termé- 
szetes nyelv (speciálisan az angol) egy mondatának. Sajnálatos módon azonban 
a számítógép ezt az idegen nyelvet csak tolmács segítségével beszéli. A legtöbb 
adatbázis-kezelő rendszer anyanyelve a relációs algebra valamilyen kiterjesztett 
változatára épül. 
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lekérdezés relációs algebral 
(avery) kifejezés 


végrehajtási 
terv 


értelmező és 
fordító 
kiértékelő 
motor 
statisztika 


adatok az adatokról 













6.1. ábra. A lekérdezés feldolgozás tipikus lépései 


Persze a fordítás csak akkor valósulhat meg, ha az SÖL nyelvet a felhasználó he- 
lyesen beszéli, ezért a fordítást minden esetben megelőzi a szintaktikni elemzés. 
Az elemzés során megvizsgáljuk a lekérdezés , helyességét": meggyőződünk arról, 
hogy a lekérdezésben szereplő relációnevek ténylegesen előfordulnak-e az adat- 
bázisban, azok elérésére van-e jogosultsága a felhasználónak, stb. A lekérdezés 
elemeit ezután le kell fordítani, és valamilyen belső - általában relációs algebra 
alapú - reprezentációba kell átalakítani, 


Miután sikerült egy malematikailag helyes kifejezést konstruálnunk az SOL mon- 
datból, érdemes pár dolgot végiggondolni. Vajon egyértelmű-e egy lekérdezég, it). 
a hozzárendelt belső reprezentáció a kiértékelés módját és a lépések sorrendjét 
tekintve? Lehetséges-e formális módszerekkel a lekérdezésünkkel ekvivalens másik 
lekérdezésíekejt konstruálnunk? Mert ha lehetséges, akkor nyilvánvalóan több vég- 
rehajtási út létezik, amelyek sebességben, végrehajtási időben, lemezhosználntban 
stb.-ben esetleg eltérnek egymástól. Ebben az esetben érdemes lenne különböző 
végrehajtási terveket ís kidolgoznunk. 


Ha már kidolgoztunk több tervet, akkor ezeket valamilyen szempont szerint össze 
kellene hasonlítani. Nyilvánvalóan az optimális megoldást keressük a problémára, 
de mi az a paraméter, amely alapján az optimalitást értelmezzük? Esetleg nem 
egy, hanem több paramétert ís számításba kell venni? Mivel bizonyosan lesznek 
eleminek tekíntett műveleteink, vajon milyen algoritmusok léteznek a végrehaj- 
tásukra, és melyiket válasszuk? Összefoglalva: optimalizációs stratégiák olanján 
végrehajtási terveket kell készíteni, amelyeket etőbb értékelni kell, majd közülük 
a legjobbat kiválasztva azt végrehajtani. 


A hálós (ld. 7. fejezet) és a hierarchikus modellben, ill. a NOSOL rendszerek- 
nél a lekérdezések optimalizálása legtöbbször a programozó feladata. Ennek oka, 
hogy az adatmanipulációs nyelven (DML) megfogalmazott kifejezések általában 
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a programokba beágyazva szerepelnek, és ezeknek optimális hálós illetve hierar. 
chikus lekérdezéssé transzformálása az egész program ismerete nélkül általában 
nem megoldható. Az optimalizációhoz tehát bonyolult algoritmus futtatására len. 
ne szükség, amely túl nagy terhelést jelentene - különösen az akkori - rendszetek 
számára. 


A relációs rendszerekben az optimalizálás megvalósítható a programozó közbe 
avatkozása nélkül is. Mivel a dominánsan deklaratív szemléletű mondatok ető 
sorban nem azt mondják meg, hogy hogyan hajtsunk végre valamit, hanem leg. 
inkább azt, hogy mit szeretnének eredményül kapni, ezért a belső megvalósítás 
rejtve maradhat. A deklaratív elvek realizálása algebrai eszközökkel megoldható. 
Köszönhetően a formális matcmatikai módszereknek viszonylag könnyű lesz egy- 
azon kérdéshez több, eredményét tekintve ekvivalens alakot találni, és kiválasztani 
közülük a legkevésbé költségeset. 


A továbbiakban megnézzük, hogy az algebrai formák hogyan támogatják a lekér- 
dezések optimalizálását. Forrnális lépéseken keresztül megkeressük egy adott SOL 
mondat több különböző ekvivalens alakját. Az eltérő alakok eltérő kiértékelési 
sorrendet jelenthetnek. Megpróbáljuk megbecsülni, melyik végrehajtása mekko- 
ra terhelést jelentene a rendszer számára. Egy egyszerű példával illusztrálva a 
lépéseket nézzük az nlábbi SOL mondatot: 


SELECT DISTINCT egyenleg 
FROM számla 
VKERE egyenleg 4 2$00; 


Egy bank nyilvántartásából szeretnénk megtudni, milyen (különböző) 2500 egy- 
ségnét kisebb értékű egyenlegek léteznek. A lekérdezést átalakíthatjuk például a 
következő két, egymással ekvivalens relációs algebrai alakba: 


Megyenlegídegyentegc2500íszámla)) 
Cegyenlege2500( egyenleg (számla)) 


Láthatóan a két alak két különböző végrehajtási sorrendet kínál. Az első esetben 
a számla relációból kiválasztjuk azokat az elemeket, amelyben az egyenleg értéke 
kisebb 2500-nál, majd ezután végrehajtunk egy projekciót az így kapott relációra. 
A második forma pont a fordított sorrendet írja le, először egy projekció, majd egy 


szelekció műveletet kell elvégezni. Ezután el kell döntenünk, melyik végrehajtási 
sorrendet kövessük. 


Az optimum mértéke lehet a lekérdezés teljes (fiktív) , költsége", amelynek a ki- 
számításához szükséges az egyes, eleminek tekintett műveletek költségeinek isme- 
rete. Sajnos a helyzet feloldása nem ennyíre egyszerű, mert egy elemi művelet 
költsége eltérő környezetekben más és más lehet. Tekintsük például a szelekció 
műveletet, amelynek végrehajtási ideje, ha lincáris keresést alkalmazunk, arányos 
a reláció összes elemének számával, azonban ha valamilyen índexet használha: 
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tunk a szelekció feltételére, akkor a kapcsolódó költséget akár egy nagyságrenddel 
is csökkenthetjük. 


Érezhetően nem mindegy, hogy milyen algoritmusokat tudunk alkalmazni az elemi 
operációk vagy kiértékelési primitívek végrehajtásánál. A primitívek összefogha- 
tóak egy nagyobb munkafolyamati egységbe, ahol egy primitív feldolgozza a bc- 
menetét, majd a kimenetét átadja a sorban utána álló műveletnek. Ha a primitív 
műveletek a relációs algebra műveletei, akkor a primitív műveletek szekvenciája 
a relációs algebrai fa (relational algebra tree). A 6.2 ábra a példánkra mutat be 
egy lehetséges relációs algebrai fát. 


Regyenleg 
Jegyenlegc2500 


] 
számla 


6.2. ábra. Egy lehetséges relációs algebrai fa 


A különböző relációs algebrai fák megalkotása még önmagában nem elegendő, hi- 
szen meg kell mondani, hogy az egyes elemi műveletek végrehajtásához pontosan 
milyen algoritrnusokat alkalmazunk, milyen fizikai segédstuktúrákat használunk, 
és hogy az egymásra épülő műveletek párhuzamossága hogyan alakul (6.4. sza- 
kasz). A relációs algebrai fa az előbbi információkkal kiegészítve a végrehajtási 
terv (exccution plan). A lehetséges tervek közül az optimális megtalálása nem 
egyszerű feladat. 


6.2. Katalógus költségbecslés 


A lekérdezés feldolgozáshoz a megfelelő végrehajtási terv kiválasztása valamilyen 
becsült költségmérték hozzárendelése alapján végezhető. Nem lehet cléggé hang- 
súlyozni, hogy becslésről van szó, nem szabad é3 nem is érdemes egzakt számokni 
várni. A becslés elvégzéséhez az adatbázis-kezelő rendszernek a relációkról külön- 
bőző statisztikákat, méröszámokat kel! karbantartania, amelyek alapján kritikus, 
hogy a költségbecslés hatékonyan legyen elvégezhető. 


A statisztikákat elvileg minden adatbázis módosító művelet után módosítani kel- 
lene, de cz óriási terhelést jelentene a rendszer számára, A valós alkalmazásokban 
a statisztika aktualizálása ezért csak akkor történik meg, amikor a rendszernek 
nyan rá ideje". Ebből következően a statisztika nem mindig konzisztens a rendszer 
állapotával, de általában elég jól leírja a rendszerben zajló folyamatokat. Így akár 
egy régebbi és/vagy hiányos statisztika is jó kiindulási alapja lehet egy elfogadható 
becslésnek. 


A statisztikákat az adatbázis-kezelők egyéb rendszerteírő paraméterek mellett egy 
ún. katalógusban tárolják. A következőkben bemutatjuk, hogy a relációkról és az 
indexekről tipikusan milyen információk találhatók meg a katalógusban. 
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6.2.1. Katalógusban tárolt egyes relációkra vonatkozó 
információk 

ny: az r relációban levő rekordok (elemek) száma (number) 

br: az r relációban levő rekordokat tartalmazó blokkok (blocks) száma 

Sr: az r reláció egy rekordjának nagysága (size) bájtokban 

Ír: mennyi rekord fér az r reláció egy blokkjába (blocking factor) 

V(A,r): hány különböző értéke (Values) fordul elő az A attribútumnak az r relá- 
cióban. V(A,r) — [74 (r)]. Speciálisan, ha az A kulcs, akkor V(A,r) — n,, 

SC(A,r): azon rekordok átlagos száma, amelyek kielégítenek egy egyenlőségi fel- 
tételt az A attribútumra (Selection Cardinality), feltéve, hogy legalább egy 
rekord kielégíti ezt az egyenlőségi feltételt. 
Például, ha az A egyediséget biztosít, akkor SC(A,r) s 1. Ha az A nem biz 
tosít egyediséget, és feltesszíik, hogy a V(A,r) különböző érték egyenletesen 
oszlik el a rekordok között, akkor SC(A,r) — VÜGY 


Az utóbbi két mennyiség definiálható tetszőleges A attribútumhalmazra ís: 
V(A,r) illetve SC(A, r). Megfigyelés: Ha a relációk rekordjai fizikailag együtt van- 
nak tárolva, akkor (optimális blokk-kihasználtság mellett): dr. — [57] A toráb- 


biakban, ha külön nem hangsúlyozzuk, mindig optimális blokk-kihasználtságot 
tételezünk fel. 


6.2.2. Katalógus információk az indexekről 


Az indexek - leggyakrabban B" fák - olyan segédstruktúrák, amelyek gyorsíthat 
ják a relációkban adott attribútum vagy attribútumhalmaz szerinti keresést. Áz 
indexek létrehozása és karbantartása, a rendszer számára nagyobb adminisztrációs 
költséggel jár, ami csak a használatuk során térülhet meg. Az egységes tárgyalás 


érdekében a hash-állományokat a továbbiakban speciális , indexnek" fogjuk tekin- 
teni. 


Az indexeket az alábbi paraméterekkel jellemezzük: 

I az átlagos pointer-szám a fa struktúrájú indexek csomópontjaiban, mint pl. a 
B" fáknál, azaz a csomópontokból induló ágak átlagos száma. 

HT;: az i index szintjeinek a száma, azaz az index magassága (Height of Tree). 
Az r relációt tartalmazó heap-szervezésű állornányra épített B" fa esetén 
HT; — (Iogy, e], ill. hash-állománynál HT; — 1. 


LB;: az i index legalsó szintű blokkjainak a száma, azaz a levélszintű indexblokkok 
száma (Lowest level index Block). 


6.2.3. A lekérdezés költsége 
A bevezetőből kiderült, hogy a különböző végrehajtási tervek költsége más és más 


lehet. Definiáljuk most pontosabban, hogy költség és optimalitás alatt mit kell ér- 
teni. A lekérdezés kiértékelés költségének meghatározása történhet az igényelt és a 
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felhasznált erőforrások alapján, ez lehet például a felhasznált proccsszoridő, a hát- 
tértárhoz fordulás ideje vagy elosztott rendszerekben a kommunikációra fordított 
idő. Egy másik kézenfekvő lehetőség a válaszidő alapján történő költségbecslés. 
Azonban, ha jobban végiggondoljuk, ez nem is olyan jó alternatíva, hiszen n vá- 
laszidő erősen függ a környezet állapotától is (egy túlterhelt rendszer valószínűleg 
lassabban generálja le a végeredményt, mint egy kevésbé leterhelt). A válaszidő 
érezhetően nem bíztosít elemi költségmeghatározási szempontot. 


A nagy adatbázis-kezelőkben a költség becslésére alapesetben a háttértár tlokkmú- 
veletek számát használják, mive) ez lényegében független a rendszer terhelésétől és 
mert ennek időigénye nagyságrenddel nagyobb, mint a processzor- és memóriamű- 
veletek időigénye. A használható költségmérték megalkotásához azonban szüksé- 
ges a probléma megfelelő szintű egyszerűsítése, Nem szabad különbséget tennünk 
az egyes blokkok elérési ideje között, azaz alapfeltételezés, hogy a diszken elhe 
lyezkedő minden blokkhoz azonos idő alatt férünk hozzá. Nem vesszük figyelembe 
a lemez forgási irányát, a fej mozgását sem. Nem tudunk különbséget tenni to- 
vábbá az egyes írások és olvasások között sem. Ez alapján legyen a költség a diszk 
blokkok olvasásának és írásának a száma azza) a további megszorítással, hogy 
az írásba csak a köztes blokkírások számát számítjuk bele, hiszen a végeredmény 
kiírása mindenképpen szükséges. 


Jelölés: Egg, 7 az algorítmus becsült költsége (cstimate). 


6.3. Műveletek költsége 


A relációs adatbázis-kezelők világában szükséges a relációkon végezhető alapmű- 
veletek definiálása, ezek lesznek azok az clemi építőkövek, amclyek segítségével 
minden más lekérdezés megszerkeszthető. Jelen anyagban csak az alapcsciekkel 
foglalkozunk. 


6.3.1. Szelekció 


Egy lekérdezés végrehajtása (pontosabban: annak kiértékelése) során egy reláció 
végigolvasása a legalacsonyabb színtű művelet. Egy adott érték megtalálását az 
adott szelekciós feltételek figyelembevétele mellett. valamilyen keresési olgoritmus 
alapján kell elvégezni. A relációk egyszerű esetben egyetlen állományban tárolód- 
nak, ezért a keresési művelet csupán egy fájlra korlátozódik. 


6.3.1.1. Alap szelekciós algoritmusok 
A kiválasztás művelet megvalósítását lehetővé tevő két alapalgoritrnus a következő: 


Al: Lineáris kercsés (, full table scan"): Minden rekordot beolvasunk, és megvizs- 
gáljuk, hogy kielégíti-e a szelekció feltételét. 41 — br 

A2: Bináris kercsés: Csak akkor tudjuk végrehajtani, ha a blokkok folyama- 
tosan helyezkednek el a diszken, a fájl az A attribútum szerint rendo- 
zett és a szelekció feltétele az egyenlőség az A attribútumon. Átlagosan 
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SC(A,r) darab ilyen rekordunk van, ezért az algoritmus becsült költsége; 


Ez — flogg br) 4 [862] - 1. 


(Az első ilyen blokk megtalálása a relációban lévő rekordokat tartalmazó 
blokkok logaritmusával arányos, az összeg második tagja pedig a szelek- 
ció feltételét kielégítő összes rekord tárolásához szükséges blokkok átlagos 
száma. A —1 azért szükséges, mert az összeg előbbi két tagja egyaránt tar. 
talmazza az első blokk olvasásának költségét.) 

Ha az A attribútum egyediséget biztosít, akkor a keresés költsége: (logyb]. 


6.3.1.2. Indexelt szelekciós algoritmusok 


A szakirodalom megkülönbözteti az elsődleges és másodlagos indexeket. Az el- 
sődleges index a rekordok olyan sorrendben való olvasását teszi lehetővé, amely 
megfelel a rekordok fizikai tárolási sorrendjének. Minden egyéb indexet másod- 


lagos indexnek tekintünk, A legfontosabb indexelt szelekciós algoritmusok ezek 
alapján a következők?: 


A3; Elsődleges index használatával, egyenlőségi feltételt a kulcson vizsgálunk: 
Az algoritmus költsége E4z — HT; tl, az index szintek plusz az adatblokk 
olvasása. 

A4; Elsődleges index használatával egyenlőségi feltétel nem a kulcson: 

E44 sz HT; [99a]. Az egyenlőségi feltételt SC(A,r) rekord elégíti ki, 


amely végigolvasásához [672] blokkművelet szükséges. 

A5: Másodisgos index használatával, egyenlőségi feltétel alapján: 
Exs - HT; 4- SC(A,r) (a második tag mutatja, hogy mennyi különbdöző 
blokkon lehetnek). Ha az A egyediséget biztosít, akkor E4s5 - HT; 41. 


6.3.1.3. Összehasonlítás alapú szelekció 


Tekintsük a cagy Ír) alakú lekérdezéseket. Ha v értékét nem ismerjük, azt mond- 
hatjuk, hogy átlagosan 5F rekord elégíti ki a feltételt. Ha ismerjük v értékét, és 
egyenletes eloszlást feltételezünk az A attribútum maximális (max(A,r)) és mini- 


mális (min(A,r)) értéke között, akkor átlagosan np : (sss ) rekord 
elégíti ki a feltételt. 


AG: Elsődleges index használatával: £45 — HT. (a keresési feltételt átlagosan 
a rekordok fele kielégíti). Ha a v-t ismerjük, és c jelöli azon rekordok számát, 
ahol A £ v, akkor: E4g — HT; 4 [A] 


AT: Másodlagos index használatával: Ea — HT, -4Éi 4. gy A második tag azt 
írja le, hogy a levélszintű indexblokkok átlagosan felét kell bejárni, hogy el- 
érjük a feltételt kielégítő rekordokra mutató index-bejegyzéseket. Az utolsó 

1 


A becslések elkészítése során elhanyagoljuk, hogy felhasznált indexrekordok hány indexblokk- 
ban vannak. 
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tagra azért van szükség, mert ha a rekordok átlagosan fele elégíti ki n felté- 
telt, akkor ezeket a másodlagos index jellegéből következően csak egycsével, 
azaz egy-egy további blokkművelettel tudjuk elérni. 


A másodlagos indexek használatával kapcsolatban meglepő következtetésre juthn- 
tunk. Áz összehasonlítás alapú lekérdezéseknél szerencsétlen esetben kifizetődőbb 
egy egyszerű lineáris keresést alkalmazni, mert az kevesebb blöokkműveletet ígé- 
nyel. j z 


6.3.2. Join operáció 


A join (illesztés vagy összekapcsolás) művelet általános értelemben két reláció 
Descartes-szorzatának adott feltétel (predikátum) szerinti szelekciója (theta-join): 


rib4r2 s og(ri x 12) 


A továbbiakban bemutatjuk a legfontosabb join típusokat, megbecsüljük, hogy 
két reláció illesztéséhez várhatóan mekkora tárterület szükséges, majd áttekintjük 
a join megvalósítását lehetővé tevő fontosabb algoritmusokat. 


6.3.2.1. A join fontosabb típusai 


—- természetes ítlesztés (natura) join): Id. 5.2.6. alszakasz. 

- 9-iltesztés (D-join, theta join): Id. 5.2.7. alszakasz. 

- külső illesztés (outer join): 
A természetes illesztés veszélye, hogy általában a kapcsolt táblák nem min- 
den sora szerepel az eredménytáblában. A külső illesztés garantáljn az össze- 
kapcsolt két tábla egyikénél vagy mindkettőnél az összes rekord megőrzését. 
Egy elterjedt implementáció jelölési konvenciója (-4-) alapján megkülönböz- 
tetjük: 

o Bal oldali külső illesztés: ta s (-)ta. Azt jelenti, hogy az eredmény- 
táblában ty azon sorai is szerepelnek, amelyek í2 egyetlen sorávnl sem 
párosíthatók. Ezen sorokban a i2-beli attribútumok értéke NULL. 

o Jobb oldati külső illesztés: tz(4-) s t2. Hasonlóan a t2 táblára. 

o Teljes külső illesztés: t1(4-) 5 ()t2. Itt mindkét tábla nem párosított 
rekordjai megőrződnek. 


6.3.2.2, Egymásba ágyazott ciklikus illesztés (nested loop join) 


Az egymásba ágyazott ciklikus illesztés egy általános algoritmus két reláció (r és s) 
theta-join műveletének implementálására. Az algoritmus logikája könnyen végig- 
követhető a megadott pszeudokód alapján. (A s művelet a konkatenációt jelöli.) 


Láthatóan ez egy elég költséges eljárás, hiszen a legrosszabb esetben br -k nr "ba 
blokkműveletre van szükségünk a teljes algoritmus lefuttatására (az r reláció vé- 
gigolvasása d, blokkművelet, és minden egyes r-beli rekordhoz az összes s-beli 
blokk végignézése pedig bs blokkművelet). 


93 


for minden t, € r rekordra do 
for minden ts € s rekordra do 
if a (tr,ts) pár kielégíti az illesztés 0 feltételét then 
] atrsis rekordot az eredményhez adjuk 
end 
end 
end 


6.3. ábra. A nested loop join-algoritmus pszeudokódja 


Ha a két reláció befér a memóriába, akkor br --bs blokkműveletre van szükség a 
beolvasáshoz. Ha a rendelkezésre álló memória csupán az egyik reláció tárolását 
teszi lehetővé, akkor is b. tbs lesz a költség. Legyen ugyanis az algorítmus szerinti 
s reláció az, amely elfér a memóriában. Olvassuk be 5-et (b5 költség), így minden r- 
beli rekordhoz az összehasonlítást gyorsan, azaz költség nélkül megtehetjük, ehhez 
játul még az r-beli rekordok br beolvasási költsége. 


6.3.2.3. Blokkalapú egymásba ágyazott ciklikus illesztés (block nested 
loap join) 


A blokkalapú egymásba ágyazott ciklikus illesztés algoritmusa ,okosabb", mint az 
előző algoritmusunk, mert kihasználja a tárolás fizikai sajátosságait. A gyorsítást 
azáltal éri el, hogy blokkalapú rekord-összehasonlítást végez: a belső két ciklus 
összehasonlítja a két reláció egy-egy beolvasott blokkjának minden rekordját, a 
külső kettő pedig végigmegy a két reláció összes blokkján. 


Az algoritmus sworst-case" költsége br :k br" ba, kedvezőbb esetben (sz első algo- 
ritmusnál bemutatott gondolatmenet alapján) br 4 ba. 


for minden br € r blokkra do 
for minden b, € s blokkra do 
for minden tr € b; rekordra do 
for minden ts € b, rekordra do 


if a (tr,t9) pár kielégíti az ittesztés 8 feltételét then 
I atr ts rekordot az eredményhez adjuk 
end 


end 
end 
end 
end 


6.4. ábra. A block nested loop join-algoritmus pszeudokódja 
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6.3.2.4. Indexalapú egymásba ágyazott ciklikus illesztés (indexed 
nested loop join) 


Az indexelt egymásba ágyazott ciklikus illesztés algoritmus kihasználja, hogy az 
egyik relációhoz van indexünk, Ha az első esetben bemutatott algoritmus belső 
ciklusába az indexelt relációt tesszük, akkor nem szükséges minden egyes s-beli 
rekordot végigvizsgálnunk, hogy megfelel-e a feltételnek, hiszen a keresés index 
alapján kisebb költséggel is elvégezhető. Az eljárás költsége bek np-c, ahol ca 
szelekció költsége 5-en, amely nyilván a konkrét indexstruktúra és indexelt szelek- 
ciós algoritmus függvénye. 


6.3.2.5, Összefésülés alapú illesztés (merge join) 


Az illesztés úgy is elvégezhető, ha mindkét relációt először rendezzük az illesz- 
tési feltételnek megfelelő attribútum szerint. Ezután már elég csak (szinkron- 
ban) végigolvasni mindkét relációt, hiszen az illeszkedő elemek a rendezés kö- 
vetkeztében egymás után kerültek. Az ilyen módon végzett illesztés költsége 
b; 4b, ka rendezések költsége. Ha a relációk igen nagyok, és hatékonyan tudunk 
rendezni, akkor gyakran ez a legkisebb költségre vezető algoritmus, 


6.3.2.6. Hash-illesztés (hash join) 


Az egyik relációt hash-táblán keresztül érjük el, miközben a másik, ,külső" reláció 
egy adott rekordjához illeszkedő rekordokat keressük. Ebben nz esetben a join 
algoritmus belső ciklusát a hash-állomány segítségével történő keresés váltjn fel. 


[ meeglagyzls A Agoin megvalósítására számos egyéb ks igÁLÁESza) is Klszlk ] 


seem mem e. 1 — em mr 9— ns rő El 1. len man nnznre mmeeemer és este ri 





6.3.3. Egyéb műveletek 


- Ismétlődés kiszűrése; (Ha ugyanabból a rekordból több példány van, akkor 
csak egy maradjon.) Először rendezést hajtunk végre. Az azonos rekordok 
közvetlenül egymás után fognak megjelenni, ekkor már könnyen törölhetők, 
Költség: a rendezés költsége. 

— Vetítés: Minden rekordra végrehajtjuk, aztán kiküszöböljük a másodpéldá- 
nyokat a fenti módszerrel, Ha a rekordok eleve rendezettek, akkor a költség 
b:, általános esetben b, 4 a rendezés költsége. 

- Egyesítés: Először mindkét relációt rendezzük, majd összefésülésnél kiszűr- 
jük a duplikációkat. 

— Metszetképzés: Mindkét relációt rendezzük, az összefésülésnél csak a közös 
rekordokat vesszük figyelembe. 

- Különtöségképzés: Mindkét relációt rendezzük, összefésülésnél csak azok a 
rekordok maradnak, amelyek csak az első relációban szerepelnek. 
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6.4. Kifejezés kiértékelés 


Áttekintettük az elemi műveletek néhány algoritmikus megvalósítását. Nem fog. 
lalkoztunk azonban még az összetett, több elemi műveletből álló kifejezések kiér- 
tékelésének módjával. 


A legkézenfekvőbb stratégia, hogy az összetett kifejezésnek egyszerre egy művele- 
tét értékeljük ki valamilyen rögzített sorrend szerint (rmaterializáció (megtestesi. 
tés, létrehozás)). Ezzel azonban van egy nagy probléma, minden művelet végre 
hajtása után a keletkezett eredményt a későbbi felhasználás miatt a háttértárra 
kell kiírni, ezért a módszer rengeteg blokkműveletet igényel. Egy másik kiértékelési 
alternatíva: egy ,csővezétékben" egyszerre több elemi művelet szimultán kiérté- 
kelése folyik, egy művelet eredményét - a háttértár bevonása nélkül - azonnal 
megkapja a sorban következő művelet opcerandusként (pipelining).: 


6.4.1. Materializáció (megtestesítés, létrehozás, materialization) 


A nagyfél név (egyenlegc2500 (számla) M betétes) kifejezést a műveletek mentén 
a 6.5. ábra szerinti relációs algebrai fába transzformálhatjuk. 


A fa leveleiben vannak a relációink, a belső csomópontokban pedig a műveletek. 
A fa alapján a materjalizációs stratégia lépései könnyen nyomon követhetőek. Az 
első lépésként hajtsunk végre egy olyan műveletet, amelyekhez az operandusaink 
rendelkezésre állnak. Éz a példánkban csak a szelekciós műveletre teljesül. Az Így 
kapott ideiglenes relációt ezután illesszük a betétes relációval, majd hajtsuk végre 
a projekciót. 


Fügyfél név 


4 


Mel 
Segyenleg a 2500 betétes 


számla 


6.5. ábra. Relációs algebrai fa kifejezés kiértékelési stratégiák illusztrációjához 


A stratégia minden relációt kiszámít a fában, miközben létrejönnek közbülső re- 
lációk is. A materializáció költsége tehát a végrehajtott operációk költségének 
összege, plusz a közbülső relációk tárolásának és visszaolvasásának a költsége. 


6.4.2. Pipelining (pipelining) 


A kiértékelés hatékonysága növelhető, ha redukáljuk az ideiglenesen tárolásra ke- 
rülő rekordok számát. Ha megszervezünk egy olyan munkafolyamatot, amelyben 
a részegységek az előttük álló elemtől kapott részeredményekből a sorban követ- 
kező számára állítanak elő részeredményeket, akkor kiküszöbölhetjük az ideiglenes 
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tárolás szükségességét. A fenti példán illusztrálva a lépéseket, mindhárom relációt 
egy pipelinc-ba tesszük. A szelekció eredményét azonnal átadjuk a joinnak, nem 
számítjuk ki előre az egész relációt. További előnye, hogy kicsi a memórinkövetel- 
mény, mert az eredményeket nem tároljuk sokáig, hanem továbbadjuk. Ilátránya, 
ha nincs közbülső reláció, nem tudunk rendezni sem (nem történik materializáció), 


A feldolgozás vezérlése alapján kétféle pipeline-t különböztetünk meg: igényirá- 
nyított és termelőirányított. 


- Az igényírányított esetben maga a rendszer fordul a csővezeték tetejéhez és 
kér rekordokat. Minden alkalommat, ha a csővezeték megkapja ezt a kérést, 
akkor kiszámítja és átadja a rendszernek. 

- Termelőirányított pipeline csetén a csövezeték mentén elhelyezkedő műve- 
letek nem várnak kérésre. A csővezeték legalsó szintjén minden művelet fo- 
lyamatosan generálja a rekordokat és egy puflerbe teszi, amíg a pufler meg 
nem telik (ugyanígy tesz minden szint). Minden színten minden művelet 
ségymástól függetlenül" dolgozik. 


6.4.2.1. Pipeliíne kiértékelési algoritmus 


Tekintsük a példánkban a 6.5. ábra join műveletét, amelynek bal oldala (a sze- 
lekció eredménye) csövezetéken érkezik. Áz egész baloldali reláció nem áll ren- 
delkezésre, a rekordok egyenként jönnek, ezért nem használhatjuk bármelyik join 
ölgoritmust (pl. a összefésülés alapú illesztés rendezés alapú illesztési algoritmus 
nem alkalmazható, ha a baloldali input nincs rendezve az illesztési attribútumok 
szerint). Az indezalapú egymásba ágyazott ciktikus iltesztés azonban használható, 
mert ahogy beérkeznek a baloldali rekordok, az illesztési attribútumértékek alap- 
ján a jobboldali reláció feletti index segítségével kikeressük a jobboldali relációból 
az illeszkedő rekordokat és összeillesztjük őket egymással. 


6.5. Relációs kifejezések transzformációi 


Láttuk az elemi műveletek és egy adott lekérdezés kiértékelésének lépéseit. A be 
vezetőben azonban említettük, hogy egy adott lekérdezéshez formális úton több, 
egymással ekvivalens relációs algebrai alakot is konstruálhatunk, amelyek általá- 
ban különböző költséggel hajthatók végre. 


6.5.1. Ekvivalcns kifejezések 


Tekintsük a következő, természetes nyelvén megfogalmazott kérdést: , Add meg 
azoknak a betéteseknek a nevét, akiknek van számlájuk Bázelben!" 


Tagyfél. név (dfiók. települése" Bázel" (fiók 04 (számla MI betétes))) 


A fenti relációs algebrai alak végrehajtása rengeteg erőforrást pazarolna, hiszen 
három reláció illesztése után végezné csak el a szelekciót. Egy sokkal hatékonyabb 
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alak a következő: 


fügyfél név Jfiók települész"Bázet" (fiók) hú (számla M betétes)) 


A második forma takarékosabban bánik az erőforrásainkkal, először kiválasztja a 
fiók relációból a Bázelben lévő fiókokat, majd csak ezt illeszti a maradék kifejezés- 
sel. A kezdeti és az átalakított kifejezés relációs algebrai fáját mutatja a 6.6. ábra. 


Mügyfél név 
I Tügytfél név 
Jfiók, település 7 Bázel" I 
; M! 
pa s gy 
S — — Of6k telenülés  .Bázd" DÍ 
fiók M 3 Zo 
/ N fiók számla betétes 


számla betétes 


6.6. ábra. Ekvivalens kifejezések relációs algebrai fája 


A legkisebb költségű végrehajtási terv megtalálása a lekérdezés optimalizáló fel. 
adata. Az optimalizáló első teendője adott lekérdezéshez ekvivalens algebrai ala- 
kök megtalálása, Majd az algebrai alakokhoz alternatív végrehajtási terveket kell 
készítenie. 


6.5.2. Ekvivalencia szabályok 


Az ekvivalens algebrai alakok legenerálásához az optimalizálónak szüksége van 
olyan szabályokra, amelyek mentén a feladat algoritmikusan elvégezhető, most 
ezeket a szabályokat vesszük sorra. Jelölések: 0, 01, 02 predikátumok, Li, La, 3 
attribútumhalmazok, E, E1, E2 relációs algebrai kifejezések, 





Megjegyzés. Emlékeztetünk rá, hogy az 5.1. szakaszban tárgyaltaknak megfe- 
lelően egy séma attribútumait halmazként kezeljük. 





1. Szelekció kaszkádosítása: 
90402 (E) — 09, (902 (E)) 
2. A szelekció kommutativitása: 


o9) (092 (5)) — 9, (ao, (5) 
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3. Projekció kaszkádosítása: 
Tej (712 (La (E)..)) sm (E) 
4. A B8-illesztés és a Descartcs-szorzat kapcsolata: 
50(E1x E2) z ELM E2 

4 4! 
99, (a ő E] -E En 
5. A O-illesztés kommutatívitása: 

E1 A Ez E 1 E 
6. A természetes illesztés asszociatívitása:r 

(EM E) Éz- EL M(E2M Ej) 


7. A szelekció művelet disztributivítása a 9-illesztés felett, ha a 0g csak Ey-beti 
attribútumokat tartalmaz: 


v0 (111 2 ) — oog( 1) 1 E 


00 


. A projekció dísztributív a 9-illesztés felett, ha Li és La E4, illetve E2e 
beli attribútumokat tartalmaz, és az illesztés feltételében csak £z UJ £2-beli 
attribútumok vannak: 


TLJULD (a e) E2) z (rea (E) b (72 (E2)) 


Az imént megfogalmazott disztributivítás általánosításaképpen tekintsük 
azt az esetet, amikor a join feltételben szereplő attribútumokra nincs meg- 
kötés. Ekkor legyen £g és £4 rendre a 0 feltételben szereplő Ez és £2-beli 
attribútumok halmaza. Li és £2 ismét csak E) illetve £5-beli attribútumo- 
kat tartalmaz: 


TLJULI (a Er) z TLjUL2 ( (ruuts (1) P (TE2uL4 (£)) 
9. A metszet és az unió kommutátivitása: 
EVE 5 EE 
BENE zENEi 


10. Az unió és a metszet asszociativítása: 
(E10 E) U E3- E) V(E2U Ez) 
(EN EJNEzz EN(E2N Ez) 
11. A szelekció disztributív az unió, a metszet és a különbség műveletek felett; 


og(Ey NE) - 09(E) vog(E2) — o9( E) X E2 
o9(E1 0 E) — oe(En)neg(E2) sola) NE - E1N09( E) 
ag( EU E2) sol) Vo9(£2) 


12. A projekció dísztributív az unió művelet felett: 
sr (EVE) sar(B)Urr(E2) 


A felsorolt szabályok nem tartalmazzák az összes ekvivalenciaszabályt, hanem 
csak ízelítőt adnak belőlük. Számos egyéb, nem csak alapműveletekre kihegyezett 
átalakítási lehetőség is létezik. 


6.6. A végrehajtási terv kiválasztása 


Az ekvivalens kifejezések gencrálása csak az első lépése az optimalizálásnak. A 
második lépésben minden egyes kifejezéshez könkrét algoritmusokat kell rendel. 
nünk. Meg kell mondanunk, hogy a műveleteket milyen sorrendben, milyen al- 
goritmus szerint, milyen munkafolyamatba szervezve hajtjuk végre. Ennek egy 
grafikus alakban megadott példa reprezentációját mutatja a 6.7. ábra. 


íreníezzük, hogy a tná- 


mi 
sodpétdányakat kiejtsűk) vé tájtlj 
MM (hash join) 
7 a VA 
(merye join) MW betétes 


( cséveetétg // ON vezeték) 


Öfók település 7 nBázei" Cegyenleg 5 1000 


(1. inder használatával (tineáris olvasás használatával) 








fiók számla 


6.7. ábra. Végrehajtási terv reprezentációja 
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6.6.1. Költségalapú optimalizálás 


A fordító az előző fejezetben látott azonosságok alkalmazásával először felsorol 
minden, az eredeti kifejezéssel ekvivalens kifejezést (véges sokat). Ezután min. 
den kifejezéshez hozzá tudunk rendelni végrehajtási terveíkejt. A megfelelő vég- 
rebajtási terv kiválasztásának folyamata tulajdonképpen a költségoptímalizálás. 
Minden végrehajtási tervre kiszámítjuk a költséget, és kiválasztjuk a legolcsób- 
bat (becslések, statisztikák alapján). Hátránya, hogy túl sokféle végrehajtási terv 
lehet, amely rengeteg munkát ró a rendszerre. Tekintsük például három reláció 
illesztését. Három relációt hatféleképpen állíthatunk sorrendbe, és ezt még be kell 
szorozni 2-vel attól függően, hogy a zárójelet az első kettő relációhoz vagy a má- 
sodik kettőhöz tesszük (ne feledjük, hogy a végeredmény ugyan minden esetben 
azonos lesz, azonban a join elvégzésének módja, erőforrásígénye még két reláció 
esetén sem azonos akkor, ha a sorrendjüket felcseréljük). Általános esetben n relá- 


ció joinja 2 e Í ! különböző ekvivalens alakot jelent (és ebben nincs is benne az 
algoritmus hozzárendelés). Ez már kis n esetén is rengeteg ekvivalenst produkál, 
pl. n — 7 esetén 665 280-at, n — 10 esetén már több mint 17,5 milliárdot! 


Szerencsére azonban nincs is szükség az összes ekvivalens kifejezésre. Némi he- 
urisztikával kezelhetőbb méretűvé csökkenthetjük a problémateret. Tekintsük a 
következő kifejezést: 

(ri Mr2 Ara) Mira Mrs 


Keressük meg először azt az optimális alakot, amely csak az első három relációt 
illeszti, majd utána az eredményt a maradék két relációval illeszti, Az első három 
reláció illesztésére 12 lehetőség adódik, majd az eredmény és a maradék két reláció 
illesztése ismét 12 lehetőséget kínál. Ha értelmetlenül minden verziót kipróbálunk, 
akkor összesen 144 lehetőséget nézünk végig. Ha azonban először megkeressük az 
első három reláció optimális kiértékelését és a 4. és az 5. relációvnl már ezt az 
optimális eredményt illesztjük, akkor a kiértékelés csupán 12 4 12 lépést próbálgat 
végig. 

A bemutatott algoritmus egyik legnagyobb problémája, hogy elméletileg ís rossz, 
mert nem minden esetben képes megtalálni az optimális megoldást. Ennek okn, 
hogy az algoritmus mohó lévén mindig a lokálisan legjobb megoldást választja, és 
nem mérlegeli azt, hogy egy kícsit rosszabb lokális megoldás globálisan csetleg jobb 
eredményre vezetne. Sajnos nem létezik olyan algoritmus, amely kis komplexitás 
mellett képes az optimális megoldást legenerálni, ezért be kell érnünk szubopti- 
mális megoldásokkal. 


6.6.2. Heurisztikus optimalizálás 


A költségalapú optimalizálás legnagyobb hátránya magának — mint láttuk - az 
optimalizációs algoritrmusnak a költsége. A legtöbb kereskedelmi rendszer ezért 
valamilyen heurisztikát használ a megfelelő kifejezés kiválasztásához. Egy heu- 
risztika alapú optimalizációs stratégia szabályai lehetnek például a következők: 
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1. Induljunk ki a lekérdezés kanonikus alakjából (Descartcs-szorzatokat, sze 
lekciókat és projekciókat tartalmaz ilyen sorrendben). 

2. Bontsuk szét a szelekciók konjunkcióját szelekciók szorzatára, hogy minden 
szelekciónak csak egy tényezője legyen. Ez lehetővé teszi, hogy a fában a sze- 
lekciókat lefelé vándoroltássuk, ezáltal a közbenső műveletek jóval kevesebb 
rekordot adjanak végeredményként. 

3. A kiértékelési fában vándoroltassuk lefelé a szelekciókat. 

4. Határozzuk meg, hogy mely szelekció és join eredményezi a legkisebb (— leg- 
kevesebb rekordot tartalmazó) relációkat. Használjuk fel a join asszociati- 
vitását, alakítsuk át a fát úgy, hogy ezek a szelekciós és join műveletek 
hajtódjanak végre először. 

5. Előfordulhat, hogy a join megegyezik a Descartes-szorzattal. Ha ezt egy 
szelekció követi, akkor vonjuk össze a kettőt egy join műveletté, így kevesebb 
rekordot kell generálni. 

6. Törjük szét a projekciólistákat. Az egyes vetítéseket lökjük lefelé a fán, 
amennyire tudjuk. Ehhez új vetítéseket is létrebozhatunk, ha szükséges, 

7. Kercssük meg azokat a részfákat, ahol csővezetéket lehet alkalmazni. 


A szabályok alkalmazásával több relációs algebrai fát kapunk, amelyek csomó- 
pontjaihoz további heurisztikák alapján algoritmusokat és pipelining-stratégját 
rendelünk. Ezeknek meghatározzuk a költségét, és vesszük közülük a legolcsób- 
bat. 


Mint láttuk, a költségalapú és a heurisztikus optimalizálás is jelentős terhelést 
jelent a rendszer számára. Nem elég tehát a legjobb megoldást megtalálni, hanem 
a kercsés költségét is optimalizálni kell. Az az érdekes helyzet adódik, hogy az 
optimális optimalizáló a saját működését (tehát a végrehajtási terv keresését) és 
magának n megtalált megoldásnak a végrehajtását egyszerre kell, hogy optimali- 
zálja. 


6.7. A fejezet új fogalmai 


szintaktikai elemzés, kiértékelési terv, szabály alapú optimalizálás, relációs algeb- 
rai fa, költség alapú optimalizálás, katalógus információk, attribútum kardinali- 
tása, kiválasztási kardinalitás, elsődleges/másodlagos index, (blokk alapú) nested 
loop join (index alapú és anélkül), hash join, merge join, materializáció, pipelining 
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7. fejezet 


A hálós adatmodell 


7.1. Története 


A hálós adatmodellre épülő adatbázisok mintapéldája a COBOL nyelv szabványo- 
sításáról ismert Conférence on Data System Languages (CODASYL) Data Basc 
Task Group (DBTG) nevű csoportjához fűzödik. Az általuk kidolgozott ajánlás- 
nak (1971-1981) két eleme van. Az adatdefiníciós formalizmus Subschema Data 
Definition Language (Subschema DDL) néven, az alkalmazói programok Írására 
alkalmas forinalizmus pedig adatlekérdező és -manipulációs nyelv (data manipu- 
lation language, DML) néven vált ismertté. Bár a XXI. századra az elterjedtsége 
marginálissá vált, még mindig vannak üzemben nagyméretű rendszerek bankok- 
ban, államigazgatásban. 


7.2. Alaptulajdonságok 


Alapvető struktúraegysége a rekord, amely számos atomi komponensből (mezők) 
tevödhet össze. A következő struktúraegység lehetővé teszi n rekordok összetar- 
tozásának megjelenítését láncolás formájában, így születnek meg a CODASYL 
terminológia szerinti setek. Egy rekord egyidejűleg több sethez ís tartozhat, Így a 
rekordok változatos - első pillantásra akár kusza - módon kapcsolódhatnak össze. 
Innen az adatmodell elnevezése. 

Egy hálós adatmodell szerint felépült adatbázisban feltehetően nem minden rekord 
különböző, hanem egyesek azonos séma szerint épülnek fel. Ezek a rekordok egy 
közös típushoz tartoznak. 


Definíció - rekord típus (record type). Az It rekord típus egy olyan 
Ar Az. sr An, n-es (tuple), ahol A;-k az attribútumnevek és minden A;-hez 


egy D; halmaz, az attribútum doménje ís hozzátartozik, amcly halmazból az A; 
attribútum értéket vehet fel. 
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Egy ft típusú, n komponensű r rekord a D) x Da x :-: x Dn Descartes-szorzatnak 
egy eleme, szintén egy n-es: rid), d2.. . ..dn)- 

Valamilyen szempontból összetartozó rekordok rendezett összefogása céljából ve. 
zették be (a példányok szintjén!) a set fogalmát, amely kétféle rekordból áll: 


- az egyenrangú member-rekordoknak egy (akár üres) halmazából, és 
- pontosan egy ouwner-rekordból, aminek a member-rekordok alárendeltek, 


Az összerendelt (tipikusan összeláncolt, Id. később) rekordok ugyanannak a kap- 
csolatnak a példányait (eseteit) valósítják meg. 


Ha a 7.1. ábrán rekordtípusl-nek pl. TANKÖR, rekordtípus2-nek HALLGATÓ 
felel meg, akkor a kapcsolatukat pl. TANUL-nak nevezhetnénk. Mivel TANUL 
minden példányában egy TANKÖR-rekord számos HALLGATÓ-rekorddal kap- 
csolódik össze, célszerű ezeket az azonosan strukturált kapcsolatokat a típusok 
szintjén is leírni. 





MT rekordtipus2 rekordtípus 1 
(.member") £.owner") 


7.1. ábra. Példa setek ugyanazon set típusból 





Definíció - set típus (set type). Legyen ti és fR2 két rekord típus és legyenek 
$(R1) és 9(R2) a konkrét esetcik halmazai. Ekkor az § set típust az § :s 
Rp x R2 művelettel definiálhatjuk, ami egy Y(ft2) — 9(R) függvényszerű 
kapcsolatot ír le, ft az owner típus, f2 pedig a member típus, 













rekord set TANUL 
Betápá típus . HALLGATÓ TANKÖR 


Member" nÖwNner" 


7.2. ábra. A hálós adatmodell egy grafikai jelölésrendszerének elemei 


A set típusokat grafikus ábrázolásban hagyományosan a member típustól az owner 
típushoz (a függvényszerűség irányába mutató) irányított nyilakkal jelezzük. 
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Egy hálós adatbázis tehát a legmagasabb szinten set típusok összességéből áll. 
Gyakran létezik egy SYSTEM" rekord típus is, amelynek egyetlen példányn van 
csupán, azonban ownerévé tehető akár minden - az adatbázisban található — re- 
kord típusnak. Ezzel az azonos típusú rekordok elérését könnyítik meg, amelyek 
általában csak több setből lennének összegyűjthetők (Id. 7.5.2. alszakasz). 


Példa. A 7.3. ábra egy egyszerű kartográfiai adatbázis set típusait mutatja be. 
Feltételeztük, hogy egy város mindig csak egy tenger (tó, folyó) mellett fekszik. 


TENGEREK (SYSTEM) 
6] FOLYÓK 
TENGERMELLETT ís FOLYÓMELLETT 


7.3. ábra. Egy egyszerű kartográfiai adatbázis hálós modellje 













A SYSTEM rekord típushoz tartozó sect típusokat a grafikus ábrázolásokon álta- 
lában nem tüntetik fel. 


7.3. Implementációs kérdések 


Elsősorban a sctek megvalósítása említésre méltó. Kézenfekvőnek tűnik, ha az egy 
ownerhez tartozó membereket egy változó hosszúságú rekordban ábrázoljuk. [a 
ft a member típus és f2 az owner típus, akkor az ft2(ft)s formájú rekordok egy 
setnek felelnek meg. A változó hosszúságú rekordok implementálására a fizikai 
szervezésnél megismert módszerek alkalmazhatók. 


Probléma akkor adódik, ha fi membere más set típusnak is, pl. fR3z ig ownere. 
Ekkor ugyanis fi példányait fel kellene R2 és Az után is sorolni, nmi közvetlenül 
nyilván nem tehető meg. 


Jobbnak tűnik egy olyan megoldás, amelyben nem kel! különböző típusú rekordok- 
nak szomszédoknak lenniük. Ilyen tulajdonságúak a láncolt listák. Legegyszerűbb 
formáját a 7.1. ábra már bemutatta: ilyenkor rekordonként egy-egy mutatót kell 
a rekordokba járulékosan elhelyeznünk, amelyek a sect (logikailag) következő tag- 
jára mutatnak. A mutatók körbe érnek, így tetszőleges, a sethez tartozó rekordról 
tetszőleges másik (akár owner, akár member) elérhető. Az owner ill. member re- 
kordok pl. a típusuk alapján különböztethetők meg. 


Ha a seten belüli keresés gyorsasága ezt indokolja, akkor a rekordok ellenke- 
ző irányban is összeláncolhatók, söt, az owner gyors eléréséhez egy-egy további 
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mutató ís beépíthető a member rekordokba, amelyek közvetlenül az ownerre mu. 
tatnak. Mindezek természetesen a setek karbantartását teszik költségesebbé, 


7.4. Hálós adatbázis logikai tervezése ER-diagramból 


Ha egy adott problémakörnek már elkészült az ER-diagramja, átalakíthatjuk azt 
hálós modellbe. Az entitás halmazoknak a rekord típusokat, a bínáris egy-több 
í(több-egy) kapcsolatoknak (a kapcsolatban résztvevő entitás halmazokkal együtü) 
pedig egy-egy set típust feleitetünk meg. 


74. ábra. Egy bináris több-egy kapcsolat megfelelője egy set típus 


A hálós adatmodellben azonban a rekordok közötti kapcsolatok csak egy-több 
(több-egy) típusú bináris kapcsolatok lehetnek - ez a tulajdonság teszi lehetővé, 
hogy adatainkat egyszerű irányított gráffal jellemezzük -, így nem képezhetők le 
közvetlenül az ER-modell olyan részletei, amelyek 


- nem követik szigorúan az egy-Ltöbb szemantikát, vagy 
- nem bináris kapcsolatot ábrázolnak, vagy 
- a kapcsolat attribútummatl van ellátva. 


A megoldás ilyen esetekben új rekord típus bevezetése, amelynek az az egyetlen 
szerepe, hogy segítségével ezeket a kapcsolatokat is néhány bináris, több-egy kap- 
csolatba transzformáljuk. Az újonnan bevezetett rekord típus elnevezése: vírtuátis 
rekord (máshol láncrekord, kapcsoló rekord stb.). 


Példa. A teljesség igénye nélkül, példaképpen nézzük meg, hogyan alakítható át 
a 4.3. ábra ER-diagramja hálós modellbe. 








KIRENDELTSÉG 


DOL-ALK 
DOLGOZIK 


7.5. ábra. Hálós adatbázis séma a 4.3. ábra. ER-diagramjából 


Az egyes rekord típusokban az alábbi mezők fognak megjelenni a setek kialakítá- 
sához szükséges mutatókon kívül: 


- KIRENDELTSÉG: k kód, hely; 
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- ALKALMAZOTT: a kód, beosztás, név, fizetés; 
- DOLGOZIK: dátum. 


Végül álljon itt ennek az adatbázisnak néhány mintnrckordja. 


(656 Tövgasen 
37 Terror] KIRENDELTSÉG 


DOLGOZIK 





Cl AT 1 tm tm mm — 4 9 e GD 09-GD 48) E. 00 45 9. 0.40 új 


ij 
M[E7sza [konyvető—— [kovástTTT [700071 
-[esez [ore Tesz [26067] 


7.6. ábra. Néhány rekord és set a 7.5. ábra modelljéhez 


ALKALMAZOTT 


7.5. Adatkezelés lehetőségei a hálós adatmodellben 


Természetesen nincs lehetőség a részletes tárgyalásra (és az értelme is megkérdő- 
jelezhető lenne), emiatt számos részlet kimaradt az alábbi leírásból. A cél elsőd- 
legesen a hálós adatkezelés bemutatása. 

7.5.1. A hálós sémalcíró nyelv (DDL) elemei 


A hálós adatdefiníciós nyelv (data definition language, DDL) két nyilvánvaló része 
egyrészt a 


- rekordtípusok, másrészt a 
— set típusok 


deklarálását teszi lehetővé. 
Egy rekord típus leírásának általános formája: 


RECORD crek. típ. név; ctárolási inf.? Ccsszök leírása; ckényszerek 


A czárolási inf.:3 mezőben a rekord típushoz tartozó rekordok fizikai tárolásá- 
nak módját lehet befolyásolni. Az azonos típus rekordok tipikusan egyetlen állo- 
mányban tárolódnak, és ezen belül az itt meghatározott mechanizmuson keresztül 
érhetők el. 


1. LOCATION MODE IS CÁLC eprocedure név? USING (mező lístay 
esetén tipikusan a rendszerbe beépített procedurák közül választhatunk, 
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amelyek pl. egy hash-függvényt határozva meg a rekordok hashing mecha- 
nizmuson keresztüli elérést teszik lehetővé, 

2. LOCATION MÖDE IS DIRECT 
esetén a rekordok csak az adatbázisbeli kulcsukon (mutató) keresztül érhetők 
el, sorrendjük tetszőleges lehet. 

3. LOCATION MODE IS VIA Cset típus név? SET 
esetén feltételezhető, hogy a crex. típ. név; típusú rekordok a cset tip. oév 
típusú setek mernber rekordjai, ezért azok a specifikált set típus owner re- 
kordja mellett kerülnek fizikai tárolásra. 


Az 1. tárolási mód esetén a rekordok elérése a cmező lista? értékei alapján ígen 
gyors lesz, nem hatékony viszont az ún. navigáció (ld. 7.5.2. alszakasz) támogatása 
szempontjából. 


A 2. tárolási mód elsősorban a itáttértár hatékony kihasználása szempontjából 
előnyös, a keresés viszont jóval lassúbb lesz, mint az előző esetben. 


A 3. tárolási mód esetén viszont támogatott a navigáció egy seten belül, de lassú 
a keresés, ha nem ísmerjűk a kérdéses rekord ownérét. 


A cnszök laírásaz mezőben kel! felsorolni a rekord típus mezőit és meghatározni a 
típusukat, hosszukkal együtt. Lehetőség van többértékű mezők (ún. vektormezők) 
és ismétlödö mezők (sőt ismétlődő csoportok) deklarálására is. 


A redundancia kezelésére virtuális mezőket is létre tudunk hozni. Ha két rekord 
típusban is szerepelnie kell ugyanazon mezőknek, akkor a két helyen történő tá- 
rolás az adatbázis potenciális inkonzisztenciájának forrása lehet. Ezt elkerülendő 
n mezőt csak egyetlen helyen hozzuk létre, a további helyeken virtuálisnak dekla- 
ráljuk. 


A cgényszerek; mezőben egyszerű előírások (constraints) fogalmazhatók meg e 
rekord mezőinek értékeire vonatkozóan. 


Pl. cHECK 15 HALLGATÓ.ÖSZTÖNDÍJ € 100000 
Egy set típus leírásának általános alakja: 
SET (set típ. név; Krendezési inf.5 


OVNER IS (rek. típ. névi? 
MEMBER IS (rek. típ. név2y cingert opciók; Kretentíon opciók; 


A rendezési int.3 mezőben azt írhatjuk elő, hogy egy setben a member rekordok 
milyen (logikai) sorrendben legyenek. Ez a sorrend úgy valósul meg, hogy az új 
rekordok a crendezési inf .3-nak megfelelően kerülnek bele a cset típ. név: típusú 
setbe. 


Pl. 


— ÚRDER IS FIRSTILASTINEXT esetén az újonnan felvett rekord a setben az el- 
ső [ utolsó ] következő lesz. A következő az ún, kurrencia mutatóhoz képest 
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értelmezett (ld. 7.5.2. alszakasz). 


— ORDER 15 SDRTED ASCENDINGIDESCENDING BY KEYS esetén a kulésmezők által meg- 
határozott sorrendnek megfelelően kerülnek bele a sctbe a rekordok. 


Áz cinsert opciók; helyén arról rendelkezhetünk, hogy egy, az adatbázisba újonnan 
felvett rekord hogyan kerüljön be egy kapcsolatba (setbe) ís, és ha bekerül, akkor 
melyikbe. (Ez a lépés nem nyilvánvaló, a hálós adatbázisban létezhetnek rekordok 
setektől függetlenül is.) 


— MANUAL esetén ,kézzel", esetleg a rekord felvétele után jóval később kell ren- 
delkezni a setbe rendezésről. 


— AUTOMATIC mód esetén a rekord valamely mező értékétől függően automati- 
kusan bekerül meghatározott setbe. 


A cretention opciók? helyén egy rekord egyedüli" létezését határozhatjuk meg: 


- OPTIONAL esetén, ha a rekord kikerül egy setből, akkor létezhet önállóan is, 


— HANDATORY esetén ha kikerül egy setből, akkor egyúttal egy másikba be kell 
kerülnie. P4.: DOLGOZÓ.OSZTÁLY mellett praktikus. 


— FIXED esetén a rekord öwnere rögzített, így egyáltalán nem kerülhet ki adott 
setből Pl.: ANYA-GYEREK 


7.5.2. Hálós DML 


A hálós adatlekérdezés alapvetően rekordortentátt, azn2 egyszerre egyetlen rekord 
kiválasztása (majd kiolvasása) támogatott. (A relációs lekérdezések (Id. 5.3. sza- 
kasz) ezzel szemben halmazorientáltak). 

Rekördesoportok eléréséhez az adatlekérdező és -maniputációs nyelv (data mnni- 
pulation language, DML) elemeit valamely procedurális gazdanyetvbe (host tangu- 
agc) kell beágyazni (COBOL, PL/I, PASCAL), amely - többek között - alkalinns 
ciklusok szervezésére ís. 

A hálós lekérdezések megvalósításának fontos kérdése ezután a csatolás megvaló- 
sítása a lekérdező nyelv és a gazdanyelv között. Ennek eszköze az ún. User Work 
Arca (UWA), amely egy pontosan definiált adatstruktúra. Felépítése a 7.7. ábrán 
látható. 


rekord sablonok 


kurrencla mutatók 


állapotváltozók 





7.7. ábra. A hálós adatbázis alkalmazások környezete: UWA 


A rekord sablonok" adott típusú rekordok egy-egy példányának tárolására alkal- 
mas terület. Egyaránt elérhető a gazdanyelvből és a lekérdező nyelvből is. Az ítteni 
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rekordok, mezők neveit célszerű az adatbázisbeli nevekkel azonosra választani, bár 
ez nem előírás. 

Azért, hogy egyik rekordot a másik után elérhessük, a megvalósított adatháló- 
ban ,mozognunk" kell - szigorúan a struktúra által meghatározott módon -, amit 
navigációnak neveznek. Így egy adott rekordból kiindulva minden más rekord el. 
érhető, ami az adott rekorddal közvetlenül vagy közvetetten kapcsolatban van, a 
sectek által meghatározva. A navigációt ún. kurrencia mutatók (currency indica- 
tor) támogatják. Értelmük a ,hol vagyok most, ill. hol voltam legutóbb?" kérdések 
megválaszolása. A kürrencia mutatók egy-egy adatbázis kulcsot tartalmaznak, me- 
lyek segítségével egy-egy rekord egyértelműen azonosítható. A kurrencia mutatók 
értékét az adatbázis-kezelő rendszer autornatikusan aktualizálja. 


A kurrencia mutatók a következők: 


- current of run-unit (CRU): a legutóbb elért rekordra mutat, 
a eurrent of record type: a rekord típusban legutóbb elért rekordra mutat, 


—- current o/ set type: az adott set típusban legutóbb elért set azonosítója: 
owner vagy member rekord adatbázis kulcsa. 


Az utóbbi két mutatóból annyi van, ahány rekord, ill. set típus előfordul. 


A UWA barmadik területén lévő állapotváltozók információkat hordoznak arról, 
hogy az adatbázis műveletek sikeresek voltak-e. Értékük minden adatbázis műve 
let után aktualizálódik. 


Pt: 


- End of set értéke igaz lcsz, ha a setben nincs több rekord. 
- FAIL hamis értéket vesz fel, ha a paranés sikercs volt. 


áttekintés a parancsokról: 


- rekord beolvasás: GET 

- navigálás: FIND 

- rekord módosítása: STÖRE, ERASÉ, DELETE, MODIFY 

— set módosítása: CONNECT, DISCONNECT, RECONNECT, REMÓVE 


Példa. Egy példa hálós adatlekérdezésre Pascal gazdanyelv mellett: 


(a USA változói és a rekord típusok nevei azonosnak feltételezéttek) 
ALKALHAZOTT  nev:s"Kovács £."; 

$FIND ANY ALKALMAZOTT USING nev f/kurrencia beállítása 

1£ FAIL 5 0 tben 


begin 
$GET ALKALMAZOTT; /rekord kiolvasása 
vriteln (ALKALMAZOTT. beosztás); /Kovács E. beósztásának 
end /kitírása 


elő6 vriteln ("Nem talált!); 
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7.5.2.1. A GET parancs 


GET (rek. típus? csező listar 


A CRU által azonosított rekord tartalmát beolvassa a crok. típus? által megha- 
tározott sablonba. Ha a két típus nem egyezik meg, akkor hibaüzenetet kapunk. 
Amennyiben csoző lista,-t ís kitőltjük, akkor csak az olt felsorolt mezők értéke 
aktualizálódik. 


7.5.2.2. A FIND parancsok 


Több formája ís létezik, céljuk a navigáció támogatása azzal, hogy minden kur- 
rencia mutató értékét — a találat függvényében - beállítja. 


Keresés adatbázis kulcs alapján 
FIND érek. típus; RECORD BY DATABASE KEY cváltozói 


ahol cváltozós egy a munkaterületen levő, DB kulcsot tartalmazó változó 
Pl. 


2 a CURRENT ÓF ALKALMAZOTT 
FIND ALKALMAZOTT RECORD BY DATABASE KEY x 
GET ALKALMAZOTT; BEOSZTÁS 


kiolvassa az ALKALMAZOTT típus legutóbb elért rekordjának BEOSZTÁS mezőjét, 
Kercsés catc kulcs szerint 





FIND érek. típusy RECORD BY CALC-KEY 


Feltéve, hogy ALKALMAZOTT-nak a LOCATION KODE-ja CALC (ráadásul a név mező alapján), 
az alábbiak szerint olvashatjuk ki Kovács Ernő fizetését: 


ALKALMAZOTT. NEV: m"Kovács E." 

FIND ALKALHAZOTT RECORD BY CALC-KEY /beállítja az ösezős kurroncia mutatót 
/fováAcs E. rekordjára 

GET ALKALMAZOTT; FIZETÉS /beolvassa a UWÁ-ba a rokordot 


Ha több Kovács Ernő is létezik az ALKALHAZOTT rekordok között, akkor azok a 

FIND OUPLICÁTE ALKALMAZOTT RECORD BY CALC-KEY 

formában találhatók meg. 

Owner rekord kercsés egy setben 

Egy set végigkercséséhez - egyik módszerrel - először az ownert kell megkercsni a 
FIND OWNER OF CURRENT set típus? SET 


paranccsal, amely beállítja a kurrencia mutatókat: a CRU a csot típuas kurrens 
setének ownere lesz, úgyszintén a kurrens set típus ís erre az owner rekordra fog 
mutatni. 
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Á set végigkeresése ezután a 
FIND FIRSTÍLASTÍNEIT érek. típus: RECORD IN CURRENT eset típus: SET 


paranccsal történhet, aminek hatására NExT esetén körbelépkedhetünk a setben a 
ncurrent of set type" kurrencia mutató által azonosított rekordtól kiindulva (ezt 
az előbb az ownerra állítottuk be). 


Példa navigációra egyik setről egy másikra. Mondjuk meg, hogy Kovács Ernőnek 
melyik évben hol voltak a cégen belül a munkahelyei (ld. 7.5., 7.6. ábrák): 


ALKALMAZOTT. NEV:5"Koöváca E." 
FIND ALKALMAZOTT RECORD BY CALC-KEY 
FIND FIRST DOLGOZIK RECORD IN CURRENT DOL ALK SET 
GET DOLGOZIK 
while FAIL s 0 do 
FIND ÖWNÉR OF CURRENT DOL KIR SET 
GET KIRENDELTSÉG 
print KIRENDELTSÉG.bely, DÜLGOZIK. dátum 
FIND NEXT DOLGOZIK RECORD IN CURRENT DOL ALK SET 
GET DOLGOZIK 
end 


A set végigkeresése adott értékű mezők után 
FIND (DUPLICATE) trek. típus? RECORD IN CURRENT set típus; SET USING cmnező listad 


hasonló az előzőhöz, de a cmező lísta:-ban felsorolt mezők előzetesen beállított 
értékeivel a talált rekordoknak egyeznie kell. 


Végül nézzünk meg néhány rekord-, ill. set-módosítási lehetőséget! Rekordok be 
írása az adatbázisba a sroRE paranccsal lehetséges. Egy rekord önállóan is megje- 
lenhet az adatbázisban, minden settől, kapcsolattól függetlenül. Pi, 


SZALLITO,NEV:a! kiss" 
SZALLITO.CIH:o"Vag u. 34, Budapest" 
STÖRE SZALLITÓ 


hatására egy új SZALLITO típusú rekordot írunk be. Egyúttal beállítódik a CRU 
erre a rekordra, a SZALLITO rekord típusnak ez a rekord lesz a kurrense és minden 
olyan set típusnak is kurrense lesz, amelynek SZALLITO ownere vagy membere. 


Annak a módja, hogy hogyan kerül be az új rekord valamely setbe, az a set típus 
deklarációjától függ (insert options: AUTOMATIC vs. HANUAL) 


A CRU által azonosított rekord kivétele a cset típusz kapcsolatból a REMOVE erek. 
tápus? FROM cset típus? paranccsal lehetséges, amennyiben a sct típus deklarációja 
nem volt HANDATORY vagy FIZED. 


A rekord tényleges törlése a DELETE rek. típus? paranccsal történik, ha erek, típus 
member típus, ill. owner, de nincs membere. 
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Vigyázat, DELETE érek, típus: ALL rekurzívan törli az összes membert, Így szeren- 
csétlen esetben akár az egész adatbázist. 


7.6. A fejezet új fogalmai 


rekord, rekord típus, set, set típus, owner, member, link, system rekorditípus hálós 
séma, navigáció, rekord sablon, kurrencia mutatók (current of run-unit, current 
of record type, current of set type), UWA 
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8. fejezet 


Objektumorientált 
adatbázis-kezelő rendszerek 


A programozási nyelvek, módszertanok területén az öbjektumorientált paradig- 
ma nem új, jól bevált. Ugyanakkor az objektumorientált (object-oriented, 00) 
adatbázis-kezelés területén hosszú ideje nem történt meg az az áttörés, ami on- 
nak idején a relációs rendszerek megjelenését jellemezte. Bevezetésül vizsgáljuk 
azt meg, hogy milyen előnyöket nyújthat egyáltalán az OO szemlélet, ill. milyen 
hátrányokra kell számítanunk. 


-- Az 00 adatbázis-kezelőktől az 00 tervezési, fejlesztési módszerek összes 
előnye elvárható: jól megtervezett struktúrák, osztályszerkezetek kialakítá- 
sával robusztus, könnyen továbbfejleszthető rendszereket, könnyen újrafel- 
használható részegységeket kaphatunk, n fejlesztés produktívabbá válik, a 
létrejövő szoltver minősége javul. Mindezen tulajdonságok — mint minden 
nagy szoltverprojektben - az adatbázis-kezelésben is nagyon fontosak. 

- Az 00 szemlélet szakítva az évtizedeken át uralkodó algoritmus- 
központúsággal, az absztrakciós szint finomításának gyakorlatával, az ada- 
tokat és a rajtuk végezhető műveleteket állította a középpontba. Az ilyen 
típusú struktúrák eltárolására a relációs modell nem bizonyult hatékonynak, 
ezért az 00 szemlélet bevezetése új adatmodelt szükségességét vetette fel. 


Az elsőként említett jellemzők minden 00 metodológiával készülő projekttel szem- 
ben elvárható alaptulajdonságok. Itt az utóbbi, adatbázis specifikus kérdésekre 
koncentrálunk. 


8.1. A relációs adatmodell gyengeségei 


Az 00 koncepciók megjelenése az adatmodellek -— adatok és rajtuk végezhető mű- 
veletek — területén elsősorban a relációs adatmodell számára jelent konkurenciát, 
mivel a 90-es évektől kezdődően a relációs rendszerek szinte egyeduralkodónak 


114 


tekinthetők, ha az iparban, ill. gazdasági életben alkalmozottakat tekintjük, nem 
pedig a kísérleti vagy speciális célokra fejlesztetteket. 


A relációs adatmodelltől alapjaiban különböző, rugalmasabb, ugyanakkor komp- 
lexebb adatmodell kialakítására már régen jelentkezett az igény. Ennek oka, hogy 
vannak olyan problémák, melyek nehézkesen képezhetők le egy relációs adatmo- 
dellre. Erre néhány egyszerű példát mutatunk be. 


Példa (1). Hogyan írhatjuk le objektumorientált módon, hogy egy autót garázs- 
ban tárolunk? 


- Objektumok: autó, garázs 
- Műveletek: tárolás 


Ezek után ha bármikor az autóra hivatkozunk, annak összes alkatrészét (is) 
értíhetjjük alatta, az objektumok összetettsége könnyen leírható. Relációs adat- 
modell használata esetén az autót érintő információt szét kell bontani relációkba; 
az autó alkatrészeit esetenként akár külön táblákba is szét kelt osztanunk: kere- 
kek, gyertyák, motor stb. Ezek után bármikor, amikor az nutóra, mint egységre 
hivatkozunk, a táblákba szétosztott adatokat az adatbázis-kezelőnek kell összevá- 
logatnia. Ez nemcsak időigényes, de logikailag összeillő adatok szétszabdalására 
is kényszeríti n rendszer tervezőjét. 


Újabb nehézség merül felt, ha menet közben derül ki, hogy az ndatstruktúrán vál- 
toztatni kell. Objektumorientált csetben ehhez csak az érintett osztályíok) belső 
szerkezetét kel! átalakítani, melynek - ha a metódusok változatlanok maradnak - 
nincs hatása a program többi részére. Relációs esetben komolyabb változtatásokra 
lehet szükség. 


Példa (2). A cclációs lekérdező nyelvek nem támogatják a rekurzív lekérdezéseket. 
Vegyünk példának egy rekurzív relációt. Célunk egy - fa analógiájú - egyszerű- 
sített vállalati struktúra leírása, ahol főnökök és beosztottak vannak. A beosztot- 
taknak legfeljebb egy főnökük van í(több-egy kapcsolat). Ez ozt jelenti, hogy n 
vállalatnál mindenki dolgozó, és más dolgozókkal való kapcsolata nlapján lehet, 
főnök és/vagy beosztott. A relációs modellben ezt egy olyan relációval írhatjuk le, 
ahol nyilvántartjuk a dolgozó adatait, majd egy olyan speciális külső kulccsal hi- 
vatkozunk a főnökére, amelyik ugyanannak a relációnak egy sorárn mutat. Tehát 
fönök és beosztott ugyanabban a relációban foglal helyet. 


Ha meg akarjuk tudni, kik egy adott főnök akárhányadik szintű beosztottjai, ne- 
hézségeink lesznek, hiszen a megismert és elterjedt relációs lekérdező nyelvek nem 
támogatják a rekurzív kérdések megválaszolását. 


Példa (3). Grafikák, folyamatábrák, CAD tervek eltárolásakor gyakran fel- 
merül az igény tetszőleges számú töréspontot tartalmazó vonalak eltárolá- 
sára. Ezt a struktúrát egy relációban pl. a következő módon tárolhatjuk: 
! Ez 2010 után kezd változni úgy, hogy egyre több (föleg webes) rendszer mögött NOSOL 


adatbázis-kezelő van (leginkább MongoDB, Cassandra, Rcdis, Id, http://db- engínee . com/ 
en/ranking). 
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VonalPontok( Vonat D, PosX, PosY, Pozíció), ahol VonallD azonosítja, hogy a 
PosX és PosY koordinátákkal megadott pontok melyik vonalhoz tartoznak. A 
Poztcio attribútum pedig azt adja meg, hogy a vonalon az adott pont hányadik 
helyen található; nem mindegy ugyanis, hogy milyen sorrendben kötjük össze a 
pontokat. Még ha a tárolás meg is oldható, kényelmesnek, kézenfekvőnek nem 
nevezhető. Megállapíthatjuk tehát, hogy a relációs adatmodell nem támogatja a 
lista jellegű információ tárolását sem (hiszen halmazszemléletű). 


8.2. Objektumorientált adatbázis-kezelők 


Az 00 adatbázis-kezelő rendszerek történelmileg két irányból fejlődtek. Áz egyik 
az objektumortentált programozási nyelvek (object-oriented programming langu- 
ages, OOPLS), a másik az adatbázis-kezelők íránya. Ahhoz, hogy adattárolás- 
ra képesek legyenek, az 00 programozási nyelveket a peérzisztencia (persistence) 
tulajdonságával kell felruházni; azaz az objektumok ne csak a program futása 
alatt létezzenek, hanem a futás befejeződése után is. A hagyományos adatbázis- 
kezelőket OO tulajdonságokkal — osztályhiíerarchiák (class hierarchics), öröklődés 
(inberitance), polimorfizmus (polymorphism), egységbezárás (encapsulation) stb. 
- kell ellátni? (8.1. ábra). 


Az 00 adatbázis-kezelők területén nem létezik egységes, szabványosított, de akár 
még csak hallgatólagosan elfogadott adatmodell sem. Szándékok léteznek ilyen 
létrehozására, ám ez már csak azért sem egyszerű, mett majdnem ,ízlés kérdése", 
hogy egy adatbázis-kezelő mely 00 tulajdonságokat és milyen formában való- 
sít meg. Azonban vannak olyan alapvető jellemzők, melyek a legtöbb adatbázis- 
kezelőben megtalálhatók. Most csak ezekre összpontosítunk. 






Perzisztens 


tulajdonságok Objektumorientált 


tulajdonságok 


O00BMS 


DBMS: Database Management System 
OÖOPL: Öbject-orlented Proagramming Language 
OGOBMS: Object-orlented Database Management System 


8.1. ábra. Az CGODBMS-ek származtatása 


1 Ezeket a rendszereket legtöbbször objektum-relációs adatbázis-kezelőknek nevezik. A továb- 
biakban, abol objektum-relációs rendszerekről van szó, azt külön hangsúlyozzuk. 


116 


A könnyebb megértés érdekében bizonyos analógiákra érdemes rámutatni az 00 
adatábrázolás és a relációs adatmodcil között - a jelentős különbségek ellenére 
is. Az 00 rendszerek objektuma egy n-esnek (a reláció egy elemének, ill. ,n táb- 
la egy sorának"), az osztály pedig a retációs sémának feleltethető meg. Az 00 
adatmodetlben (object-oriented data model) ezután sémadefiníció alatt az osztá- 
lyok és a köztük fennálló kapcsolatok leírását értjük. Az 00 adatmodell ezen a 
ponton sokkal inkább a hálós modellhez hasonlít, hiszen a relációs modellben di. 
rekt kapcsolatok nem léteznek. A különböző osztályokhoz tartozó objektumok és 
a köztük lévő kapcsolatok (asszociáció, association) összessége képezi magát az 
00 adatbázist. 


8.2.1. Típuskonstruktorok 


Minden programozási nyelv és adatbázis-kezelő rendszer ismer bizonyos alaptípu- 
sokat (Integer, Real, Character stb.). Ezeknek létezhetnek bizonyos előre definiált 
kiterjesztéseik (Date, Time stb.) is. Azonban a felhasználó által definiált tetszőle- 
gesen bonyolult típusokat (struktúrákat) a relációs modellben nem tudunk leírni, 
Erre a problémára megoldásként az 00 adatbázis-kezelők egy része közvetlenül 
vagy közvetve a típuskonstruktorokat (type constructor) nyújtja. 


Példa (4). Lássunk három alap típuskonstruktort: 


Halmazkonstruktor: Tsa — SET OF(A: T), ahol A attribútum, T pedig az 
attribútum típusa. A halmaz típus legfontosabb jellemzője, hogy elemei rendezet- 
lenek. 


Listakonstruktor: Tis 5 LIST OF(A: T), ahol A attribútum, T pedig az 
attribútum típusa. A lista típusra jellemző, hogy elemci szekvenciálisan rendezete 
tek. A programozási nyelvek láncolt listájával analóg struktúra kialakítására ad 
lehetőséget. 


Tuplekonstruktor; Tune 5 TUPLE ORA) : T,.. An : Th), ahol A; attri- 
bútum, T; pedig az A; attribútum típusa. A tuple típus a relációs modellben a 
reláció egy elemének felel meg. 


A típuskonstruktorok tetszőlegesen bonyolult - akár bicrarchikus módon is történő 
- felhasználásával kapott típusok komplexításukban hasonlítanak a Pasca! nyelv 
record illetve a C nyely struct fogalmához. 


8.2.2. Kapcsolatok - asszociációk 


Az 00 adatbázis-kezelők nagy újítása, hogy tetszőlegesen bonyolult kapcsolato- 
kat is átláthatóan tudnak kezelni. Ezeket a kapcsolatokat a szakírodalom - a 
más , kapcsolatoktól" való megkülönböztetés érdekében - gyakran asszociációnak 
(association) nevezi (8.2. ábra). Az asszociációkat osztályokra definiáljuk, így az 
asszociációk az osztályok példányai, az objektumok között teremtenek kapcsola- 
tot. 


117 


Objektum 1 Objektum 2 










kapcsolat 
(asszociáció) 


Objektumreferencia  Öbjektumazonosító 


8.2, ábra. Az objektumazonosító és az objektumreferencia 


Ha egy A objektum kapcsolatban áll egy B objektummal, ez azt jelenti, hogy A-ból 
B elérhető. Ha B-ből is elérhető A, akkor az asszociáció kétírányt. Asszociációk 
segítségével könnyedén leírhatjuk a több-több típusú (pl.: tanár-diák) kapcsola. 
tokat is. A kapcsolatok mentén történő objektumról objektumra lépkedést itt is 
navigációnak nevezik. A navigációnak a lekérdezések során van elsősorban jelentő- 
sége. Egy objekturmnból kifelé irányított asszociáció mentén elérhetünk egy újabb 
objektumot, melynek nyilvános adatmezőihez így hozzáférhetünk. Az asszociáció 
kiindulási oldalán otjektumreferencia (object reference), azaz a célobjektum ob. 
jektumazonosítója (object identifier) található. Az objektumazonosító szolgál arra, 
hogy - még ha az objektumok tartalma teljesen azonos is — az objektumokat meg 
tudjuk különböztetni, 


Az asszociációk mentén terjedési tulajdonságokat (cascade relationship) is meg- 
határozhatunk, mint pl, az objektum törlése, zárolása vagy zár felszabadítása. Ez 
azt jelenti, hogy ha egy olyan A objektumot törlünk lc, melynek egy másik B 
objektum felé törléssel terjedő asszociációja volt, akkor ez a bizonyos másik B 
objektum is törlődik. Ha B objektumnak ís van ilyen asszociációja C objektum 
felé, akkor ugyanez történik tovább korlátlan mélységben. 


Példa (5). Erdész megbízónk arra kért, hogy egy spcciális erdőrészletet vegyünk 
nyilvántartásba a fák főbb ágaival és az azokon fészkelő madarakkal együtt. A 
fáknak vannak ágaik; az ágak további ágakra bomolhatnak és így tovább. Az ága- 
kon helyenként fészkek találhatók melyben lehetnek madarak, fiókák, ill. tojások. 
Mivel a fák nagyon öregek, előfordul, hogy ha villám csap beléjük, akkor kidölnek. 
Ilyenkor a tojások és a fiókák odavesznek, a szülőmadarak pedig elrepülnek. 


Hogyan ábrázoljuk ezt a struktúrát az asszociációk és a terjedési tulajdonságok 
felhasználásáva!? (8.3. ábra) 


Az ábrán vastaggal jelöltük azokat a kapcsolatokat, amelyek mentén terjed a tör- 
lési tulajdonság. Visszafelé, jobbról balra haladva értelmezzük az ábrát. A tojások 
és a fiókák megsemmisülnek ha a fészek megsemmisül. A szülők tovább élnek at- 
tól még, hogy a fészek elpusztul. Tovább lépve balra: a fészek elpusztul, ha az 
ág, amire építették letörik, elég stb. Az ág rekurzív módon akkor semmisül meg, 


118 


ha bármelyik olyan ág elpusztul, amelyik neki ,őöse". Ezt fejezi ki az önmngába 
visszatérő rekurzív asszociáció. Ha pedig a fa? elpusztul, az összes ága is elpusztul, 


8.3. ábra. Terjedő asszociációk 


8.2.3. Verziókezelés (version control) 


Különösen nagy rendszerek esetén jól jöhet, ha az objektumok állapotát nem csak 
az adott pillanatban ismerjük, hancm korábbi állapotaikat ís előhívhatjuk. Erre 
szolgálnak a verziók (versions), melyek kezelését a legtöbb 00 adatbázis-kezelő 
rendszer támogatja (ld. még 10.9.4, alszakasz). 

A verziók fejlődése lehet lincáris és elágazó. Nem kizárt különböző verziók újbóli 
negymásra találása" sem. 


5.50 


8.4. ábra. Verziók 


Példa (6). Nézzük meg egy autómodoll fejlesztését (8.4. ábra). Kezdetben gyár- 
tottak egy modellt (VI), amit évről évre fejlesztgettek (V2). Amikor jól kezdett 
menni a cégnek, kínálatszélesítésként több almodcilt is elkezdtek gyártani (V3, 
V4) (nyitható tető, kombi stb.), melyek a maguk útján tovább fejlődtek (V5). 
Később költségkímélés miatt beszüntették a széles skála gyártását, ismét csak az 
alapmodellel foglalkoztak (V6), amiben viszont megtalálható volt az összes eddíg 
külön fejlesztett ág jó néhány tulajdonsága. 


8.2.4. Nyelvek 


Hasonlóan az 00 adatbázis-kezelőkhöz, a lekérdező nyelvek is két irányból fejlőd- 
tek. 


5  Didaktikailag talán helyesebb lenne ebben a kontextusban fa helyett fatörzsről beszélni. 
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Az egyik út - melyet elsősorban a relációs adatbázis-kezelők gyártói járnak - az 
SOL 00 kiterjesztésének megalkotása. A legjelentősebb ezek közül az S0L3 szab. 
vány (150/IEC 9075-2:1999). Az SOL3 a hagyományos relációs lekérdezéseken 
felül ismeri és kezeli az absztrakt adattípust annak minden tulajdonságával (me- 
tódusok, öröklés, objektumazonosság, polimorftizmus stb.). Az SOL3 könnyebben 
integrálható más programozási nyelvekkel, mint elődei voltak (Id. 8.3. szakasz). 


" A másik út, ami előttünk áll, egy 00 nyelv perzisztens tulajdonságokkal való 
ellátása. A legtöbb napjainkban működő 00 adatbázis-kezelő megalkotásánál a 
Ct- perzisztens kiterjesztését választották. Egyre jelentősebb azonban a (Sun 
által kifejlesztett") Java nyelv, melyhez egyre több rendszer kínál elérési felületet. 


Mig a relációs adatbázis-kezclőknél az esetek többségében külön kellett foglal- 
koöznunk adatdcfiníciós, adatmanipulációs és bost (gazda) nyelvekkel, 00 eset- 
ben ezek egységes egészként jelenhetnek meg. Az adatdefiníció például ugyan- 
úgy C44-ban készülhet, mint a lekérdezések. Az adatbázis-kezelő nyelvének más 
nyelvbe történő beágyazására pedig értelemszerűen nincs szükség, hiszen példá- 
ul az SOL-t legtöbbször éppen C-be ágyazzák be. Azzal, hogy nem csak az 
ndatbázis-alkalmazás fejlesztése, hanem maga az adatbázis-kezelés is egy 00 prog- 
ramozási nyelven történik, az absztrakciós távolság a két terület között lecsökkent, 
czáltal a teljes rendszer implementációjának a hatékonysága nött. 


8.3. Az objektum-relációs technológia 


Az 00 szemlélet hosszabb idő alatt, fokozatosan hatolt be a relációs adatbázis- 
kezelés világába. Először az 00 alkoalmazásfejlesztő eszközök jelentek meg, amc- 
lyekkel klasszikus relációs adatbázis-alkalmazásokat lehet hatékonyan fejleszte- 
ni. Az objektum-rectiációs (objcct-relational, OR) alapgondolat szerint a relációs 
rendszerek összes előnyét megtartva (leckérdezésoptimalizálási lehetőség, kiforrott 
technológia stb.), 00 tulajdonságokkal látják el a relációs adatbázis-kezelőt. Ezt 
a szemléletet követi még napjainkban is a relációs adatbázis-kezelök gyártóinak 
egy - piaci részesedés alapján mindenképpen - jelentős hányada. 


Lehetőségeiben hasonló a két rendszer: polimorftzmus, komplex kapcsolatkialaki- 
tás, automatikus objektum-hierarchia tárolás stb. Az objektum-hierarchia reláci- 
ós adatmodellre képzése hathatós rendszertámogatással történik. A lekérdezések 
nemcsak objektumok szerint hajthatók végre, hanem a deklaratív SOL segítségé- 
vel a valóságos tárolás helyéül szolgáló táblákból közvetlenül ís megtehető. 


4 A Sun 2009-től már az Oracle tulajdonában van. 
5 Azonban oz adatbázis-kezelőt leggyakrabban valamilyen alkalmazásprogramozási interfészen 
(application programming interface, APT) keresztűl ípl. ODBC, JDBC) érik el, 
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8.4. Összegzés 


Az 00 és OR adatbázis koncepciók megítélése napjainkban még nem egyér- 
telmű. Bizonyos tekintetben még visszalépés is történt a relációs adatbázis- 
kezelőkhöőz képest. 


- Mivel az OO adatbázis-kezetők mögött nem áll olyan hatékony műtemű- 
tikai modell, mint ami a relációs rendszereket támogatja, csak korlátozott 
lehetőségek mutatkoznak a lekérdezések optimalizálására és/vagy a séma — 
nagyrészt - automatikus egyszerűsítésére. Mivel OR esetben az objektum. 
hierarchia leképezése táblákra automatikusan történik, az bonyolult csetek- 
ben pazarló, ésszerütlen lehet. 

- Míg a reiációs modell alapkoncepciója teljesen egységes, nem létezik ilyen 
egységes 00, ill. OR modell. 

- A relációs lekérdezések deklarativitása forradalmi újítás volt megjelenésük- 
kor. Az 00 lekérdezések pedig jellemzően mégiscsak navigáción nlapulnak. 
Az OR rendszerek egyebek mellett éppen a relációs lekérdezések lehetőségét 
nem akarják feladni. 


Másrészről az 00 adatbázis koncepciók újítása a hagyományos - elsösorban re- 
lációs - adatbázis-kezelőkhöz képest az, hogy az emberi gondolatok számítógép 
számára történő leképzésénél alkalmazott absztrakciós lépcső kisebb, azaz elkép- 
zeléseinket sokkal terrnészetesebben vetíthetjük le ilyen rendszerekre. Említésre 
méltó még, hogy az 00 rendszerek - bizonyos esetekben jóval -— gyorsabbak le- 
hetnek relációs társaiknál. OR adatbázis-kezetők esetén erre a sebességnövekedésre 
- a háttérben lévő relációs motor miatt - nem számíthatunk. 


Felmerül tehát a kérdés: Mikor érdemes 00 adatbázis-kezelőt használnunk? Ál- 
talában olyan esetekben, amikor az objektumok közötti kapcsolatok és az objek- 
turnok struktúrája komplex és nem feltétlenül az adatok változatos szempontok 
szerinti hatékony lekérdezése a legfontosabb. Tipikusan ilyen alkalmazások lehet- 
nek a telekommunikáció, a számítógéppel segített tervezés (computer-aided design, 
CAD), a számítógéppel segített szoftvertervezés (computer-aidcd soltware engine- 
ering, CASE), a térképészet-geográfia, a multimédia stb. területének problémái. 
Ezeken a területeken az 00, ill. OR adatbázis-kezelő rendszerek egyre intenzívebb 
előretörése várható, 


8.5. A fejezet új fogalmai 


objektum, osztály, öröklödés, polímorfizmus, rekurzív lekérdezés, asszociáció, ob- 
jektumreferencia, objektumazonosító, típuskonstruktor (halmaz, lista, rekord), 
terjedési tulajdonság, verziók, 50L3, objektum-relációs technológia 
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9. fejezet 


Relációs adatbázisok logikai 
tervezése 


Bár a relációs adatmodell nem is az egyedüli, nem is a legjobb minden szem- 
pontból, mégis, a legelterjedtebb adatbázis-kezelő rendszerek még ma (2016) is 
n relációs adatmodellen alapulnak. Emiatt kitüntetett jelentősége van a relációs 
adatbázisok tervezésének. Jelen jegyzetben ezért szántunk a problémának külön 
fejezetet. 


A tervezés első lépésben az adatbázis logikai tervezésére terjed ki (csak ezután szo- 
kás a fizikai tervezést végezni, tehát pl. a segédstruktúrákat kialakítani, tárolási 
paramétereket meghatározni), hiszen konkrét feladat megoldásához általában va- 
lamely megvásárolható relációs adatbázis-kezelő rendszert használnak fel. Ilyenkor 
nincsen sem mód sem szükség az adatbázis-kezelő működésének számos részletét 
megváltoztatni. A tervezés ekkor teltát arra korlátozódik, hogy meg kell határozni 
az adatbázis logikai szerkezetét (fogalmi (logikai) adatbázis: a relációs sémákat, 
definiálni kell az egyes adattípusokat), fizikai szerkezetének a paramétereit, a cél- 
szerűfszükséges segédstruktúrákat (fizikai adatbázis), majd meg kell írni magát 
az adatokat manipuláló programot /programokat, az adatbázis alkalmazásokat. Az 
alkalmazásokban az adatbázishoz való hozzáférés alapulhat pl. a szabványosított 
SOL nyelven, amelyet beágyazhatnak valamely magas szintű procedurális nyelv- 
be, de jellegzetesen valamilyen API-n (alkalmazásprogramozási interfész) keresztül 
hívják meg. Az alkalmazásfejlesztésnek számos, különböző szinten automatizált 
fejlettebb módszere is létezik. 


Bárhogyan is hozzuk létre az alkalmazásainkat, az első lépés mindig az adatbázis 
logikai (koncepcionális) megtervezése. A tervezésnek két karakterisztikusan kü- 
lőnböző módszerét ismertetjük a továbbiakban, amelyek azonban kombinálhatók 
is, és adott esetben jól kiegészítik egymást. 
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9.1. Tervezés ER-diagramból 


A 4.2. szakaszban megismerkedtünk az ER-diogrammal, amely szemléletes ábrá- 
zolásmódja következtében hatékonyan támogatja a valóság modellezésének folya- 
matát. Az 5. fejezetben megismerkedtünk a relációs adatmordtellel. Természetes az 
az igény, hogy ER-diagramokat relációs sémákká kíséreljünk meg átalakítani, Így 
alapozva meg a valóságot jól modellező relációs sémák kialakítását. Az átalakítás 
teljes, ha megmondjuk, hogy az ER-diagram clemeit hogyan kell a relációs adot. 
modell megengedett adatstruktúráiba (értsd: relációs sémátk)ba) transzformálni. 


1, Az egyedhalmazokat olyan rclációs sémával ábrázoljuk, amely tartalmaz- 
za az entításhalmaz összes attribúturmát. A reláció minden egyes n-ése az 
entitáshalmaznak pontosan egy példányát fogja azonosítani (Id. 9.1. ábra). 
Ha az entitáshalmazok között olyan is van, amelynek egyes attribútumait 
egy (általánosabb) entításhalmaz egy ,isa" kapcsolaton keresztül megba- 
tározza, akkor a specializált entitáshalmazboz rendelt relációs sámába az 
általánosabb cntitáshalmaz attribútumait is fel kell venni. 





9.1. ábra. Entitásbalmaz transzformációja relációs sémába 


2. A kapcsolattípusokat olyan relációs sémákká alakítjuk, amelyek attribűtu- 
mai között szerepel a kapcsolatban résztvevő összes entitáshalmaz kulcsa ís 
(ld. 9.2. ábra). Feltételezzük, hogy két entításhalmaz valamely kulcsattribú- 
tuma nem azonos nevű még akkor sem, ha az entitáshalmazok megegyeznek 
(mint pl. a HÁZASSÁG: EMBER, EMBER kapcsolatban). Névkonífliktus csetén az 
attribútumokat átnevezéssel kell megkülönböztetni. Áz így kapott reláció- 
ban minden egyes n-es olyan entitáspéldányokat rendel egymáshoz, amelyek 
a szóban forgó kapcsolatban vannak egymással, 


[Er] CR R(A1.A2,...,Ak,81.82,...8n.C1.C2.....Cm) 


Etkulcsa E2külcsa E3 tá] 





9.2. ábra. Kapcsolat transzformációja relációs sémába 
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A kapcsolatok relációs sémákba átalakítására a kopcsolat funkcionolitása és egyéb 
tulajdonságai (pl. specializáció kifejezése esetén) függvényében számos más lehe- 
tőség ís van, amelyek adott esetben jobbak is lehetnek a bemutatott, egészen 
általános módszertől. 


Ha pl. a 4.2. ábrán a DOLGOZIK : EMBER, OSZTÁLY kapcsolattípust akarjuk relációs 
sémákba transzformálni, akkor kihasználhatjuk a kapcsolat N:1 jellegét (függvény- 


szerűségét), és az általános módszerből adódó három relációs séma helyett már 
kettővel is kifejezhetjük a kapcsolatot: 


— OSZTÁLY(OSZT ID, OSZT NÉV, ÉPÜLET, EMELET) 
-— EMBER(SZEM SZÁM, NÉV, ANYJA NEVE, SZÜL DÁTUM, OSZT ID)! 


Vegyük észre, hogy így ráadásul a relációs sémák struktúrájába sikerült belcépi. 
tenünk a kapcsolat függvényszerűségét biztosító kényszert is, amít elveszítettünk 
volna akkor, ha az általános módszer szerint transzformáltuk volna a kapcsolatot, 





Megjegyzés. Egy több-egy kapcsolat két relációs sémába történő leképzésekor 
A több" oldalon álló egyedhalmaznak megfelelő relációban az idegen kulcsnak 
megfelelő attribútum(ok) NULL értéket vehetnek fel (pl. a fenti példában ha 
egy ember nem dolgozik egyik osztályon séin, akkor az OSZT, ID attribútuma 
NULL lesz). Azzal, hogy két relációs sémát hozunk létre, az eredeti információ 
kinyeréséhez eggyel kevesebb természetes illesztés művelet szükséges, 










Vegyük észre továbbá azt is, hogy az ER-diagram relációs sémákba alakításával 
elveszítettük az egyedek és kapcsolatok formális megkülönböztethetőségét. 





Példa. Transzformáljuk relációs sémákká a 4.3. ábra ER-diagramját! Relációs 
sémák az entitáshalmazokból: 


- KIRENDELTSÉG(KKÓD, HELY) 
— ALKALMAZOTT(AKÓD, NÉV, BEOSZTÁS, FIZETÉS) 


Relációs séma az egyetlen kapcsolatból: 
- DOLGÜZIK(KKÓD, AKÓD, DÁTUM) 
Strukturálisan ezek a relációs sémák pontosan ugyanúgy néznek ki, mint a 


- K(KK, H) 

— A(A, N, B, F) 

— D(KK, A, D) 
sérnák, azonban legfeljebb a kényszerek (kulcsok, idegen kulcsok) segíthetnek ab- 
ban, hogy a sémák eredetére következtetni lehessen. 


: Azokat az attribútumokat, amelyek egy adott relációs sémában nem, de egy másikban kul- 
csattribútumok, szokás szerint kétszeres aláhúzással jelöljük. Ennek az elnevezéset ídegen 
(vagy külső) kulcs (Id. még a 9.2.3.2.3. bekezdést). 
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9.2. Tervezés sémadekompozícióval 


Ha az ER-modellezés segítségével jutunk el a relációs sémáinkhoz, akkor n sémák- 
ban található attribútumokat és a relációk (valamint a teljes, az adatokon műve- 
leteket végző adatbázis alkalmazás) további tulajdonsógait az fogja megbatároz- 
ni, hogy milyen ,ügyesek" voltunk az ER-diagram megalkotása során. A relációk 
azonban tetszőleges számú attribútumot tartalmazhatnak. Így akár a rendszerben 
található valamennyi adatot beépíthetjük egyetlen sémába (ún. univerzális sémá- 
ba), és ekkor egyetlen tábla írja le az egész rendszert. Ez a felhasználó számára 
roppant kényelmes, hiszen nem kell tudnia, hogy melyik adatot melyik reláció 
tartalmazza, így bizonyos lekérdezésekhez nem kell a relációk összekapcsolásával 
sem vesződnie, csupán ki kell válogatnia a számára érdekes adatokat. 


Másrészről - pi. tárolási és adatmanipulációs hatékonyság szempontjából - ez a 
megközelítés nem elönyös, mert általában sok , felesleges" adatot is tartalmaz. 
Ezek kezelése lassítja a rendszer működését, a háttértárat és a memóriát felesle- 
gesen foglalja, az adatbázist következetlennéfellentmondásossá teheti, 


A többször tárolt adatok egy adatbázisban, ill. relációban feleslegesek lehetnek. 
Nem minden többször tárolt adat felesleges. Ha egy reláció azt tartalmazza, hogy 
kinek milyen színű a szeme, akkor a ,barna" (vagy annak a kódja) igen sokszor is 
előfordulhat ugyanabban a relációban, mégsem érezzük ezt feleslegesnek. Ugyan- 
akkor feleslegesnek érezzük, ha ugyanannak a személynek a szeme szine fordul elő 
többször ís a relációban. Ezt a. hétköznapi nyelvben is redundanciának nevezzük, 
mert máshonnan is tudhatjuk, hogy az illető szeme színe barna. Általánosabban: 








Definíció - redundáns reláció. Ha cgy relációban valamely attribútum értékét 
a relációban található más attribútum(ok) értékéből ki tudjuk következtetni va- 
lamely ismert következtetési szabály segítségével, akkor a relációt redundánsnaek 
nevezzük. 


A kikövetkeztethető adatokra gyakran azt mondjuk, hogy származtatott adatok. 


Példa. Az alábbi reláció szállítók adatait tartalmazza, ki milyen árut (TÉTEL) 
mennyiért (ÁR) szállít és a szállító (NÉV) hol lakik (CÍM)? 














CÍM TÉTELT ÁR 
[Bp.Füu.5. — ftégia [30 
Bp.Fau.§. [vas 1200 
70 
I Baja u.9. — Í pala Í 20 


Ózd Petőfi u. 11. [ cement 1350 


NÉV 
Tóth István 
Tóth István 
Kis János 
Kis János 
Nagy Géza 






















2? Vegyük észre, hogy az áruszállítás ténye, Ül. az, hogy egy edott szállítónak mil n Inkefime, 
valamint, hogy egy adott árucikknek mi az ára, mind ezáltal van kifejezve, hogy n megfelelő 
adatértékeket egyazon sorba Írva összerendeltük őket, ugyanakkor az összetendelés pontos 
szemantikájáról az adatstruktúra elemei - szigorúan véve — semmit nem mondanak. 
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Ha feltételezzük, hogy egy szállítónak csak egyetlen címe lehet, akkor ebben a 
relációban a címek többszörös tárolása teljesen felesleges, redundanciát okoz. 


Vegyük észre, hogy az egyes relációk redundanciáját csökkenthetjük, ha az adatbá- 
zist alkalmas módon több, egyenként kevesebb attribútumot tartalmazó relációból 
alakítjuk ki. 


9.2.1. Anomáliák (data anomalies) 


A redundáns relációknak megfelelő adattárolással kapcsolatban egy sor kellemet- 
len jelenség fordulhat elő. Ezeket hagyományosan anornáltáknak nevezik, 


9.2.1.1. Módosítási anomália (update anomaly) 


Tételezzük fel, hogy Tóth István címe megváltozik. A változást elvileg annyi helyen 
kell átvezetni, ahány helyen Tóth István címe szerepel. Ha csak egy helyen is ezt 
elmulasztjuk (pl. rendszerősszeomlás miatt), később különböző helyekről többféle 
címet is kiolvashatunk. Az ilyen szituáció tehát nemcsak többletmunkát jelent, 
hanem az inkonzisztencia lehetőségét is magában hordozza. 


9.2.1.2. Beszúrási anomália (insertion anomaly) 


Ennek lényege, hogy nem tudunk tetszőleges adatokat nyilvántartásba venni, ha 
nem ismert egy másik adat, amivel a tárolandó adat meghatározott kapcsolatban 
áll. Más szavakkal: nem tudunk a relációba olyan elemet felvenni, amelynek olyan 
mezője kitöltetlen (NULL), amely a reláció definíciója miatt nem lehet kitöltetlen. 
Ez a helyzet egy reláció kulcsmezőivel. Pl.: egy új szállítót nem tudunk felvenni, 
ha még nem szállított semmit. 


Másrészt, ha a fenti példában Tóth István elkezd egy harmadik tételt is szállítani, 
de cnnek az adatbázisba írásánál a lakcímére már nem a Bp. Fa u. 5.-öt adjuk 
meg, hanem pl. az új lakcímét, Bp. Rönk u. 17.-et, akkor elveszítjük Tóth István 
lakcímét, hiszen ezután már nem tudhatjuk, hogy mi a lakcíme valójában, 


9.2,1.3. Törlési anomália (deletion anomaly) 


Ha csak egy attribútum értékét szeretnénk törölni, akkor előfordulhat, hogy ez 
valamiért nem lehetséges (pl. mivel része valamely kulcsnak). A kérdéses attri- 
bútumértéktől ilyenkor úgy szabadulhatunk meg, ha az egész sort töröljük, de 
ilyenkor elveszíthetünk olyan adatokat/információkat ís, amelyekre még szüksé- 
günk lehet. 

Ha pl. a cement tételt akarjuk törölni, akkor az egész sort kell, de ekkor elveszítjük 
Nagy Géza címét ís. 

A fenti problémákat megoldhatja a relációk függőleges felbontása? (vertikális de- 
kompozíciója). Az építési anyag szállítók relációját például két részre célszerű fel- 
bontani: 

3 Az ún, sémafelbontást késöbb, a 9.2.5. alszakaszban definiáljuk. 
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szállító építőanyagok 





SZÁLLÍTÓ CÍM SZÁLLÍTÓI TÉTELT ÁR 
Tóth István Í Bp. Fa u. 5. Tóth István 
Kis János . 9. Tóth István 
Nagy Géza zd Petőfi u. 11. Kis János 
Kis János 
Nagy Géza 





A felbontás módja most nyilvánvalónak tűnik, de a valóságban ez ritkán van így. 
Ezen kívül számos probléma is felmerülhet. Nem világos pl., hogyan lehet biztosí- 
tani, hogy az eredeti reláció mindig helyreállítható legyen. Továbbá: hogyan lehet 
jó flelbontásokat készíteni? Milyen értelemben jobb az egyik felbontás a másiknál? 


Ahhoz, hogy ezekre a kérdésekre válaszolni tudjunk, az adataink mélyebb ismerete 
szükséges. 


9.2.2. Adatbázis kényszerek (data constraints) 


Adatbázis kényszerek alatt azokat n szabályokat értik, amelyek segítségével az 
adatbázisunk tartalmát olyan módon lehet jellemezni/korlátozni, hogy az vala- 
mely tervezésnek, ill. elképzelt/elvárt feltételeknek megfeleljen. A leggyakrabban 
használt kényszerek az alábbiak (vő. 5.4.5.1. alalszakasz): 


- értékfüggő kényszerek (pl. 0 c TESTMAGASSÁG c 300) 
- értékfüggetlen kényszerek 
6 Tartalmazási függőség (pl. az idegen kulcsok értékeinek halmaza rész- 
halmaza a neki megfeleltethető kulcsértékek halmazának) 
o Funkcionális függőség (ld. 9.2.3. olszakasz) 
o Többértékű függőség (Id. 9.2.8. alszakasz) 


9.2.3. Funkcionális függőségek (functional dependencics) 


Láttuk, hogy a relációs adatbázisok hatékony működtetésének egyik központi kér- 
dése a relációkon belüli redundancia csökkentése. Hogyan is keletkezett a redun- 
dancia? Legegyszerűbb formájára a szállító relációban láttunk példát. A redun- 
dancia ott két okból keletkezett: 


1. A szállító nevét több sorban is fel kell használnunk az általa szállított kű- 
töndtöző tételek azonosításához. 

2. Ha feltételezzük, hogy a valóság úgy , működik", hogy nincs két azonos nevű, 
különböző lakhelyű szállító, akkor minden olyan sorban, ahol megjelent egy 
szállító neve, törvényszerűen megjelent ugyanaz a lakcím is, ami nyilván 
felesleges ahhoz, hogy tudjuk, hol lakik a szállító. 


Ez utóbbi tényt úgy is kifejezhetjük, hogy azt mondjuk: a NÉV attribútum ér- 
téke egyértelműen meghatározza a CÍM attribútum értékét, tehát minden olyan 
két sorban, amelyekben a NŐV értéke megegyezik, megegyezik a CÍM értéke is, 
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A jelenségnek megfelelő matematikai konstrukciót funkcionális (fűüggvényszerű) 
fűggőségnek (vagy függésnek) nevezik, melynek pontos definíciója a következő: 








Definíció - funkcionális függés (functional dependency), Legyen adott az 
R(At, An... An) relációs séma, ahol A;-k,  — 1,2,... , n (alapjattribútumok, 
Legyen X és Y a reláció attribútumainak két részhalmaza: X C RésYCR. 
Ha bármely, az ft sémára illeszkedő r reláció bármely két t,t € ríft) sorára 
fennáll az, hogy ha t(X] — FIX], akkor ey) — éfyY] (ahol t(Z] jelenti: m2(t)-t, 
azaz a t n-cs 2 attribútumhalmazra eső vetületét), akkor azt mondjuk, hogy az 
Y attribútumok funkcionálisan függenek az X attribútumoktól. Más megfogal- 
mazásban azt is mondhatjuk, hogy az X értékei megbatározzák az Y értékeit. 
Mindezt így jelöljük: X GY. 








A definíció szoros kapcsolatban van a jegyzetben már korábban is többször fel- 
bukkant implikáció műveletével (ld. A. függelék). 


Példa. Vegyük a következő két állítást: 


- A állítás: ,nz Jt sémára illeszkedő bármely r reláció bármely két t,t" sorára 
t(x] 5 élx)" 
- B állítás; ,ttyi - t(YT" 


Ekkor az A — B implikáció teljesülése esetén definíció szerint funkcionális függés- 
ről beszélünk az X és az X attribútumíhalmazjok között. Formálisan erre vezettük 
be üz X — YV jelölést. 


Megjegyzések. 


1. A funkcionális (üggőség definíció szerinti teljesüléséhez nem követelmény, 
hogy egy R sémára illeszkedő bármely r reláción vatóban legyen két olyan 
t,t sor, amelyre fennáll, hogy EX) — £1XI (azaz nem követeli meg, hogy 
az A állítás igaz legyen). Ha tehát egy konkrét R sémára illeszkedő r relá- 
cióban nincsen ilyen két t,€f sor, az X — Y függőség akkor is fennállhat. 
Ekkor nyilván nem lehet ellenőrizni, hogy t(Y] s éfY] igaz-e (azaz a B 
állítás igaz-e), miközben a funkcionális függés fennáll (ez a helyzet, ha pl. 
egy relációnak csak egyetlen eleme van). Ez összhangban van az implikáció 
definíciójával: az implikáció értéke akkor is lehet igaz, ha az A állítás nem 
igaz, azaz nincsenek az X attribútum(halmazjon megegyező sorok. 

2. Érdemes külön kitérni a definíciónak arra a feltételére is, hogy bármely 
ríR)-re (amit a gyakorlatban úgy is lefordíthatunk, hogy ,bármely idő- 
pillanatban"). Gyakori az, hogy egy adott ríIt) relációban ítehát pl. egy 
kiválasztott időpillanatban) minden olyan t, (" sorra, melyre é[X] — é[Xx] 
fennáll t(Y] — £fY] is. Ilyenkor eseti funkcionális függőségről beszélünk. 
Megkülönböztetésül ezért néha az eredeti (fenti) definícióval kapcsolatban 
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érdemi funkcionális függőséget emlegetünk. Amikor a valóságos viszonyo- 
kat kívánjuk modellezni (pl. egy információs rendszerben, a rendszer ter- 
vezrésének fázisában), az természetesen az érdemi függőségek segítségével 
történhet. Ugyanakkor egy működő rendszer használata során, az adntn- 
innk elemzéséhez az eseti függőségeknek lehet nagyobb szerepe. Az cset 
függőségek összessége csak bővebb lehet, mint az érdemi függöségeké. A 
továbbiakban, ha nem hangsúlyossuk külön, akkor - a jelen jegyzet céljatval 
összhangban - csak éntemi fűggöségekről lesz szó. 

3. Az előzőekből az ís következik, hogy a funkcionális függöségek meghatáro- 
zása egyfajta modellezési kérdés. Ez azt is jelenti, hogy egy reláció egyetlen 
pillanatnyi állapotából sohasem dönthető el egy (érdemi) függőség fennál- 
lása, legfeljebb arra következtethetünk, hogy mely függőségek nem állnak 
fenn. 

4. Láthatóan a funkcionális függések egy relációban csak akkor okoznak re- 
dundanciát, amennyiben valamely X — Y funkcionális függés mellett n 
relációnak valóban van legalább két olyan eleme, amelyek X-ben azonosak, 
Ma viszont az X (szuperjkulcs, akkor cz a feltétel garantáltan soha nem 
fog teljesülni (ld. Boycc-Codd normálforma, 9.2.4.5. alalszakasz), ill. ter- 
mészetesen az ís előfordulhat, hogy az f sémára ( véletlenül") csak olyan 
elemeket illesztünk, amelyek mellett az X értékek különbözőek. 


Példa. Az S(NÉV, CÍM, VÁROS, IRÁNYÍTÓSZÁM, TELEFON) relációs sémá- 
ban a valóságot , elég jól" modellező funkcionális függőségek pl. az alábbiak: 


CÍM, VÁROS -s IRÁNYÍTÓSZÁM (ha ismerjük a címet és a város nevét, 
akkor ehhez egyértelműen tartozik egy irányítószám) 


IRÁNYÍTÓSZÁM — VÁROS (egy irányítószámboz csnk egy város tartozik) 
NÉV a CÍM 

NÉV a VÁROS 

NÉV a IRÁNYÍTÓSZÁM 

- NÉV 5 TELEFON (ha nincsenek azonos nevek, akkor egy névhez egyértel- 
műen tartozik egy lakcím, városnév, irányítószám és telefonszám) 


Adott ft sémán értelmezett (megadott, ismert) funkcionális függöségeket gyakran 
egyetlen halmazba gyűjtjük össze: czt a halmazt jelöljük pl. Fp-rel. 


Megadott funkcionális függöségekből kiindulva a továbbiakban számos új fogalmat 
definiálunk, melyekre a későbbiekben hívatkozni fogunk: 
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9.2.3.1. Determináns 


Definíció - determináns fdeterminant set), Ha X.Y € ítés X GY, de dx c 


X, hogy X" G V, akkor X-et Y determinánsának nevezzük. 


















Definíció - teljes fűggés (full dependency). Ha X,Y C RésX GY, dejxX c X, 
hogy AT 6 Y, akkor azt mondjuk, hogy Y teljesen függ (funkcionálisan) X-től. 





Megjegyzés. Vegyük észre, hogy az imént definiált teljes függés és a determi- 
náns valójában ugyanannak a két megközelítése: ha X,Y € R esetén X deter- 


minánsa Y-nak, akkor és csak akkor Y teljesen függ X-től. 





Definíció - részleges függés (partiat depcndency), Ha X.Y CC RésXOoY 
mellett 34" € X, hogy A" Y, akkor Y részlegesen függ X-től. 





9.2.3.2. Relációs sémák kulcsai 


Az ÉR-modellezésnél már használtuk a kulcs fogalmát. A fizikai szervezésnél ís 
előkerült a (kercsési) kulcs fogalma, Ott azt mondtuk, kulcs minden, ami szerint 
keresni akarunk. 


Most megadjuk egy relációs sémán értelmezett kulcs matematikai definfcióját is. 
Az előző szakaszban bevezetett jelöléseket alkalmazzuk. 





Definíció - kulcs (relációs sémáé) (key). X-et pontosan akkor nevezzük kulcsnok 
az f? relációs sémán, ha 


"1 .Xa Rés 
2. jX c X, hogy X OR 


Más szavakkal akkor, ha R teljesen függ X-től. 





9.2.3.2.1. Szuperkulcs, kulcs 


Definíció - szuperkulcs éstperkey]. X-et szuperkulcsnak nevezzük, ha ígaz, hogy 


X 3 R. Más szavakkal akkor, ha X tartalmaz kulcsot, 





Néha hangsúlyozandó egy kulcs minimális voltát minímátis kulcsról beszélünk. 
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Ha egy kulcs csak egy attribútumból áll, akkor egyszerű kulcs (simple key), egyéb- 
ként összetett kulcs (composite key) a neve. 


Példa. Az építőanyagok (9.2. szakasz) relációs sémájának a (NÉV, TÉTEL) att- 
ribútumhalmaz (összetett) kulcsa, ha nz ottani funkcionális függöségeket értel- 
mezzük a relációs sémán. 


A jelen szakaszban definiált S relációs sémának a (NÉV) (egyszerű) kulcsa. Egy 
szuperkulcsa lehet pl. a (NÉV, TELEFON) attribútumhalmaz. 
A kulcsok nébány fontos tulajdonsága: 


1. a kulcs a relációnak egy és csakis egy elemét (, sorát") határozza meg, 
2. egy kulcs attribútumai nem lehetnek NULL-értékűek (azaz értékük imegha- 
tározatlan). 


Tétel. Minden relációs sémának van kulcsa. 


Bizonyítás. Válasszuk ugyanis az attribútumok teljes halmazát, Ez a külcsok- 
ra vonatkozó első feltételnek eleget tesz, hiszen nincs olyan attribútum, nmit ne 


vettünk volna figyelembe. Tehát meghatározza a relációs séma minden attribú. 
tumának értékét. Ha a második feltétel is teljesül, akkor kulcs, ha pedig nem, 
akkor szuperkulcs, tehát tartalmaz kulcsot. 





9.2.3.2.2. Elsődleges kulcs 










Definíció —- elsödleges kulcs (primary kcy). Ha X és Z az A relációs sémánnk 
egyaránt kulcsai, miközben X s Z, akkor az ft relációs sémának több kulcsa is 
van. 

Ezek közül kiválasztunk egyet, amelyet elsődleges kulcsnak (primary key) neve- 
zünk. A többi kulcsot kulcsjelöltnek (candidate key) hívjuk. 





9.2.3.2.3. Idegen (külső) kulcs 


Definíció - idegen kulcs (forcign key). Adott egy ft és egy R" relációs sétna. 
Tételezzük fel, hogy X / R. HA3DC RNR), hogy D 6 HR és D minimális 
- azaz R" kulcsa -, akkor D neve az f? sémával kapcsolatban idegen kulcs, Más 
szavakkal: egy sémában lehetnek olyan attribútumok, amclyek egy másik sémá- 
ra illeszkedő relációban a sorokat egyértelműen azonosítják, tehát ott kulcsok. 
Ezeket idegen kulcsoknak nevezzük. 
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9.2.3.3. Funkcionális függőségek további tulajdonságai 


A korábbiak alapján már sejthetjük, hogy a megadottakon kívül más funkcionális 
függőségek ís igazak lehetnek, Egy jó példa erre a iríviális függóség, amit ugyan 
ritkán hangsúlyozunk, amikor az adatok egy valóságos helyzetbeli jelentését írjuk 
le funkcionális függőségekkel, de attól még fennáll. Ha egy A séma tartalmazza 
az A és B attribútumokat, akkor mindig fennállnak ezen a sémán az UBB 
vagy az AU B — A függőségek is. Hiszen minden R sémára illeszkedő r relációban 
vett € r(R) elemekre, ha t(A U 8] — F[AU B], akkor t(B8] — £(B], valamint 
t(A] 5 é(A] egyaránt törvényszerűen fennáll. 


Jelölés: na továbbinkban az AU B helyett egyszerűen AB-t írunk. 


Ha azonban több függőség is ismert, vagy a sémának számos attribútuma van, ak- 
kor már nem nyilvánvaló annak a megválaszolása, hogy mi az adott Fn függőségek 
mellett még fennálló függőségek teljes rendszere. Mivel ennek a kérdésnek pl. a re- 
lációs sérmatervezésnél nagy jelentősége lesz, ezért a cél az, hogy az összes függőség 
előállítására a gyakorlatban is jól használható módszert" adjunk. A ,módszer" 
következtetési szabályok, ún. axiómák alkalmazása lesz, Ezektől az axiómáktól a 
következő két alapvető tulajdonságot várjuk el: 


— csak olyan függőségeket lehessen velük előállítani, amelyek igazak", ugyan- 
akkor 

- meg lehessen kapni" minden ,igaz" (funkcionális) függőséget, amelyek egy 
adott függőséghalmazban található függöségekkel nincsenek ellentmondás- 
ban. 


Az igaz"! és n ,meg lehet kapni" kifejezések alatt pontosan az alábbiakat értjük; 














Dofiníció - igaz (funkcionális függés) (sound (functionat dependency)). Egy 
adott R sémán az attribútumain értelmezett Fgx függéshalmaz mellett egy 
KX o Y függőség pontosan akkor igaz, ha minden olyan r(f) reláción fennáll, 
amelyeken Fg összes függősége is fennáll. : 


Jelölése: FgFX BY. 











Definíció - , meg tehet kapni", azaz levezethető (funkcionális függés) (deducible 
ffunctionat dependency)). Egy W 6 Z funkcionális függőség pontosan akkor 
vezethető le adott Fp függőségekből, ha az axiómák ismételt alkalmazásával 
Fnp-ből kiindulva megkaphatjuk IV — 2-t. 


Jelölése: FgFk W a Z. 


Az imént definiált tulajdonságokkal bíró — valójában következtetési - szabályok 
Armstrong , ariómái" néven váltak ismertté. 


§ Eredetileg ,sound", de a magyar szakirodalomban ennek az nigaz" fordítása terjedt el. 
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9.2.3.4. Armstrong axiómái a funkcionális függőségekről 
Adottok az ft sémán az X.Y, Z attribútumhalmazok. 


a) Ha XA CY, akkot Y 5 X íroflexivitás vagy triviális függőség). 
9) Hx.X.56Y és Y 6 Z, akkor X — Z (tranzitivitás). 
c) Ha X 5 Y, akkor AZ - YZ (bővíthetőség). 





Megjegyzés. Az axiómák tömören: 
a) XGCYEYOX 
b XGYAYOZHEX OZ 
e) XGYEAZO YZ 




















Tétel - igazság tétel (soundness thcorem]). Az Armstrong axiómák igazak (he 
lyesek), alkalmazásukkal csak igaz függőségek állíthatók elő adott függéshalmaz- 
ból. 


Formálisan: FR XGY 5 FpkXOY 


Bizonyítás, Lássuk be egyenként, hogy az axiómák igazak, akkor nyilván igaz 
lesz minden olyan föüggöség ís, amelyet az nxióinák (véges számban) ismételt 
alkalmazásával knpunk (azaz le tudunk vezetni). Lássuk be pi., hogy c) igaz! 


Ehhez tételezzük fel, hogy c) nem ignz, bár X 6 Y fennált, Ez azt jelenti, hogy 
36, n-esek valamely ríft) relációban, melyekre t(XZ) z f(XZ], de ely Z] sé 
é(YZ]. 

A 2-hez tartozó attribútumok nyilván megegyeznek a t és t sorokban, hiszen 
különben t(XZ] és ((XZ] nem lehetne azonos. Tehát az Y-beli attribútumok 
értékében különbözik t(YZ) és éfY 2], azaz t]Y] A €fY]. De ez nem lehetséges, 
mert a kiindulási X 5 Y függőség miatt ha t/X] — (XI, akkor t(Y] - €éfY]. 
Tehát ellentmondásra jutottunk c) tagadásával, így c) igaz kell, hogy legyen. 


§ Eredetileg: soundness thoorein, Emtatt talán Jobb lenne helyésség tételnek nevezni, de nem 


cz honosodott meg. 


Tétel - teljesség tétel (completeness theorem]. Az Armstrong axiómák teljcsek, 
azaz belőlük minden igaz függőség levezethető. Formálisan: FREXOY 5 


Fpt.X 6 Y (Nem bizonyítjuk.) 





Megjegyzés. Mostantól kezdve a F és a F jeleket egyenértékűeknek, feleserél- 
hetőknek tekinthetjük. 
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9.2.3.5. Az nxiómák következményei 

dd X GY és X OG ZEX 5 YZ (egyesítési szabály). 

e) XGY és WY GO ZFAXWG Z Ípszeudotranzítivitás). 

DD XGYÉSZGYEAX — Z (dekompozíciós/felbontási szabály). 
Fentiek most már az Armstrong axiómák felhasználásával is bizonyíthatóak, Lső 
daképpen nézzük meg d) bizonyítását! 
Bizonyítás. XA aYtkX 5 XY (c) miatt) 
XaZtXxYa ZY (e) miatt) 
X a XYésXAYOZYEX— ZY (b) miatt, ami éppen a bizonyítandó állítás.) 
Példa. Vegyük elő újra az F( NÉV, TÉTEL, CÍM, ÁR) sémát a rajta értelmezett 
NÉV, TÉTEL 6 ÁRés NÉV a CÍM függöségekkel! Keressük meg R kulcsát! 
NÉV, TÉTEL 5 ÁRH NÉV, TÉTEL a ÁR, NÉV, TÉTEL 
NÉV a CÍME NÉV, TÉTEL — CÍM, TÉTEL. 
Az egyesítési szabályt alkalmazva adódik, hogy NÉV, TÉTEL a ÁR,NÉV, 
TÉTEL, CÍM. 


Mivel NÉV, TÉTEL együttesen meghatározza ft mindegyik attribútumát, ezért 
NÉV, TÉTEL együtt (szuper)kulcsot alkotnak. Láthatónn bármelyik nttribútu- 
mot is hagyjuk el, már nem fogja ft mindegyik attribútumát meghatározni, tehát 
a (NÉV, TÉTEL) attribútumhalmaz minimális is, azaz kulcs. 


9.2.3.6. Attribútumhalmaz lezártja 


Gyakran felmerülő kérdés, hogy bizonyos attribútumok értékeinek ismeretében 
esetleg milyen más ottribútumok értékeit tekinthetjük még ismertnek azt kíhasz- 
nálva, hogy a (funkcionális) függőségek rendszerén keresztül egyes attribútumok 
meghatározzák más attribútumok értékeit, Lényegében ezt fejezi ki az alábbi de- 
finíció: 


Definíció - attribútumbalmaz lezártja (fattribute closure). Az X atiribútum- 
halmaz lezárása udott F függéshalmaz mellett az a legdbővebb IV C ft halmaz, 
amelyre az X — W függőség az adott F függéshalmaz mellett fennáll. Jelölése: 


Xt(F) 
Formálisan: Xt(F)- (AlA€ Rés PEkX o 4) 





Tehát VY-ra, amelyre X — Y igaz, hogy Y C Xt, és megfordítva: VY-ra, amelyre 
YCEXT igaz, hogy X GY. 

Algoritmus: Egy attribútumhalmaz lezárása csaknem lincáris időben meghatá- 
rozható az alábbi algoritmus segítségével, melyet addig folytatunk, mígnem az 
XCI ún. tezárt-kezdemény már nem nő tovább (azaz X(it) — xi), 
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xX0-x 
XB ze XUL AJBV CAO VO UE Pt AE U) 


Példa. Adott az R(A, B,C, D) séma és an funkcionális függőségek £ hatmnza: 
Fz(A5 B. Bo D) Miaz X s AC attribútumhbalmaz lezárása, Xt? 


Xx00 a ac 
XŰ - ACUÍB) (A — B miatt) 
X(9 - ACBU(D) (B 5 D miatt) 


Mivel X() - ABCD, vagyis az ft séma attribútamnainak teljes halmaza, így az 
algoritmus véget ért, Xt z ABCD, amiből az is következik, hogy AC szüperkulesn 
a relációnak. (Mivel AC minimális ís, ezért valójában kulcs.) 


9.2.3.7. Függéshalmaz lezártja 


Láttuk, hogy (funkcionális) függöségeket definiálva Ármsirong nxiómái segítségé- 
vel továbbiakat ís meg tudunk határozni, söt mindegyiket, amelyik logikailag a 
megadottakból következik. Gyakran hasznos, hn ezekre a függőségekre közösen 
tudunk hivatkozni. 





Definíció - függésbalmnz lezártja (closurc of functional dependency set). Az F 
függéshatmaz lezárása mindazon függőségek halmaza, amelyek az £ függéshnl- 
mez elemeiből az Armstrong axiómák alapján következnek. 


Formálisan: Ft -(XGYIPEXOY) 





Még ha F viszonylag kicsi is, £t igen nagy lehet. In ni. F s (45 B.B73C), 
akkor Ft elemei: Ft (A B.BOoC Aa AB, AB B. 8-6 BC DC CC 
4 CC ABOCAG8 434860, B6 B,...) (0 az üres halmaz, jele). 


Tanulság. Könnyen belátható, hogy - az adott függőségek szerkezetétől függően 
- a lezárt halmaznak 2? számú eleme ís lehet (söt, néhn inég több is), így a 
lezárt meghatározása esetenként igen költséges művelet. Ez az oka annnak, hogy 
a függéshalmaz lezártjára elméleti megfontolásokban gyakran fogunk hívatkozni, 
gyakorlatban használható algoritmusaink ellenben lehetőleg nem támaszkodnak a 
meghatározására. 


Gyakori az a feladat, hogy el kell dönteni egy függőségről - legyen ez A 5 B -, 
hogy következik-e adott F függöséghalmazból. A feladat direkt megoldása lehetne, 
hogy kiszámítjuk Ft-t és megvizsgáljuk, hogy elemei között van-e A 5 B. Füg- 
géshalmaz lezártjának költséges számítása helyett gyorsabban eredményre jutunk, 
ha (lincáris időben!) At-t határozzuk meg a megismert algoritmussal. Amennyi- 
ben B € At, akkor A 5 B E Ft. Ez az attribútumhalmaz lezártja definíciójának 
közvetlen következménye. 
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Ha függőségeknek egy bonyolult rendszere adott, gyakran szeretnénk könnyebben 
áttekintető, egyszerűbb formába alakítani — nyilván úgy, hogy közben az új alak 
ugynnazt az ,információt" hordozza, mint az eredeti, Ez alatt azt értjük, hogy a 
módosított függéshalmaz segítségével pontosan ugyanazokat a függőségeket lehes- 
sen előállítani. A függéshalmaz lezárása segítségével lehetőségünk van arra, hogy 
egyszerű definíciót ndjunk két függéshalmaz egyenlőségére. 





Definíció - függéshalmazok ekvivalenciája (eguivalence of functional depen- 
dency sets), Két függéshalmaz pontosan akkor ekvivalens, ha lezártjaik meg- 
egyeznek. 

Ezt így jelöljük; F s G 5 FF zGt és azt ís mondjuk, hogy F lefedi G-t, ill, 
G lefedi F-et. 






Láttuk, hogy az ekvivalencia eldöntése a definíció alapján igen költséges lehet, így 
a gyakorlatban használhatóbb sz alábbi algoritmus; 


Vizsgáljuk meg, hogy FC Gt és GC FT egyaránt teljesül-e. Ha igen, akkor 
ekvivalensek, 

Először az F € GY teljesülését vizsgáljuk. Minden X 5 Y € F függőöségre 
n tartalmazás hatékonyan eldönthető X(G) kiszámításával: ha Y € Xt(G), 
akkor XGYEGTGEFT eldöntése nyilván azonos elven törlénbet, 


Definíció — minimális függéshalmaz (minimal set of functionat depcndencies), 
F minimátis függéshatmaz (beszélünk F minimátis fedéséről ís) akkor, ha 

1. a föggőségek jobb oldolán csak egyetlen attribútum van, 

2. 6 függőségek bal oldaláról nem bagybató el attribútum, 

3. nincs olyan függöség, amely elhagyható. 


Tétel. Adott föggéshalmazzal ekvivalens minimális függéshalmaz mindíg előál- 
lítható. 


Bizonyítás. Konstruktív, ami egyben algoritmust is ad a minimális függéshal- 
maz előállítására, 


Adott egy F függéshalmaz. 





1. A felbontási szabály alapján minden X a Y E F függőség helyet- 
tesíthető X a Ap X a Az....X 2 An függőségekkel (ahol Y — 
(Ar Az. s An), így egy F" függéshalmazt kapunk. Nyilvánvaló, hogy 
F és F" ekvivalensek. 

2. Minimalizáljuk a függőségek bal oldalát. Enhez vizsgáljuk meg VS 5 BE 
F" függőségre, ahol S — (D), Da, . . ., Dn). hogy elhagyható-e valamely D; 
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oltribútum. Definíció szerint ehhez az kell, hogy et z F" Hi fennálljon 
(ahol F" z FYIS 5 BIU((DDa Di 1 Dia Dn) a 8) 
ami ekvivalens az FC FT és FE FT egyidejű fennállásával. A 
függéshalmazok csak egyetlen függésben különböznek: 
- PF" —(Xi 9 Ar AX29 Azt .g (D1, De, . ... D; h D;, Dan. 5.4 Dn)- B) 
je. F"SZ(XIR An X2A Aa. (Dn Da... Di hp Dia.t 1. DnP B) 


FG FV! ezért ekvivalens BEST F"), vngyis 
BeSt FY(S—5 BYUTID, Da... Di. 1 Dia. Dn) 5 BŐ) 
vizsgálatával, F" c pyt pedig 
B E (D1. Da... Di nDizasss s Da)! FF) 
vizsgálatával. Mivel 
Best FNIS-5 BJYU((D1,D2..... Dr 1. Dia Da) 9 B) 


iríviálisan teljesül S — (Di. D2,..., Da) mintt, elegendő csupán a má- 
sik irányt megvízsgálni. Eredinényül egy F" függéshalmazt kapunk, amely 
továbbra is ekvivalens F-fel. 

3. Vizsgáljuk meg VT 5 C e F" függésre, hogy elhagyható-e. Definíció 
szerint ehhez az kell, hogy F"Y(TocyYT - pt fennálljon, ami- 
nek az eldöntése költséges. Célszerűbb ezért azt vizsgálni, hogy € E 
Tt PSY(T 56 C)) vajon teljesül-e — amint már korábban beláttuk, ez 
ekvivalens, ugyanakkor hatékonynbb. Végül egy olyan F" függéshalmazt 
kapunk, amely továbbra is ekvivalens F-fel, de n minimális függéshalmaz 
mindegyik tulajdonságának megfelel. 











Megjegyzés. Vegyük észre, hogy a 2. és 3. lépésekben az egyes attribútumok, 
ill. függőségek cihagyásának sorrendje tetszőleges. Ennek következtében a vég- 
eredményül kapott minimális függéshalmazok különbözőek is lehetnek. 


Következmény. Egy adott függéshalmazzal ekvivalens minimális függéshalmaz 
nem feltétlenül egyértelmű! 


Példa. Adott: Fz(4Bo CD, AC5G BD, CG AB), mi egy minimális fedése? 


1. F" (AB CABa D.ACG BACO DOG AC B) 

2. CG A miatt az AC— B függőség C — B-re, A€ 5 DC — D -re redu- 
kálható: F" z (AB5 C ABa DC B.C5 D,C52 A). (A függőségek 
száma azért csökkent, mert C G B szerepelt az eredeti függéshalmazban 
is.) 
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3. 486 Cés CG D miatt (a tranzitivitási axióma következtében) ARO D 
elhagyhntó. A kapott függéshalmaz minimális: 
Fj -(AB6 6.05 D,.€— 4, €— B). 
A minimális fedés nem egyértelmű, mert F"-ből C 5 A.C a Bés ABO D 
miatt C a D elhagyható, ekkor 
F; z (ABH CC ABO DC- BC A). 


.2.4. Relációs sémák normálformái 


Ahhoz, hogy a 9.2.1. alszakaszban ismertetett anomáliákat elkerülhessük, a reláci- 
óink sémái meghatározott feltételeket kelt, hogy teljesítsenek. Ezeket a feltételeket 
normálformáinak nevezik (Codd, 1970). A normálformák tehát megszorítások a 
relációs séma tulajdonságairn vonatkozóan annak érdekében, hogy a sémákra íl- 
leszkedő relációkkal végzett műveletek során egyes nemkívánatos jelenségeket el- 
kerülhessünk. 


9.2.4.1. A nulladik normálforma (ONF) 


Ilyen alakúnak tekintünk minden olyan relációs sémát, amelyben legalább egy 
attribútum nem atomi nbban az értelemben, hogy az attribútum értéke nem te- 
kinthető egyetlen egységnek, azaz egyes részeihez külön is hozzá akarunk férni, 
Nullndik normálforma (ONF)-ben van az a relációs séma, amelyik pl. ismétlődő 
csoportot tartalmaz az attribútumai között. 


Példa. Adottak az alábbi attribútumok: 
- EGYETEM NÉV 
- REKTOR 
o KAR 
o DÉKÁN 
$ TANSZÉK 
: VEZETŐ 


Ekkor az alábbi séma ONF alakú: 
UNKEGYETEM. NÉV, REKTOR(KAR, DÉKÁN(TANSZÉK, VEZETŐ) 5) e) 


A s jellel az ismétlődő csoportokat jelöltük. 


9.2.4.2. Az első normálforma (1 NF) 






Definíció - INF. Egy relációs séma INF alakú (vagy más szóvai normalizált, 
normalized), ha csak atomi attribútum-értékek szerepelnek benne. 
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Megjegyzés, Az INF alak definíciója nyilvánmlónn nem n redundancin csök- 
kentést szolgálja. Egyszerűen csak kiindulási alapot teremt n további nortnalizá- 
lás számára. Hacsak nem hangsúlyozzuk külön az ellenkezőjét, a továbbiakban 
mindig feltételezni fogjuk, hogy n sémáink normalizáltak a fenti értelemben. 


9.2.4.3. A második normálforma (2NF) 


Definíció - elsődleges és másodtagos attribútumok, Egy ft relációs sémn A € ft 


attribútuma elsődleges attribútum (primory attribute), ha A eleme a sérna vala- 
mely A kulcsának. Egyébként A másodlagos attribútum (secondary attribute). 





Ezek szerint egy relációs séma kulcsai az attribútumokat két diszjunkt halmazba 
sorolják: ha R kulcsainak halmaza (I1.462,..., Enh ahol KK; C R, akkor UK; 
az elsődleges attribútumok, VUK; pedig a másodlagos attribútomok halmnza. 





Definíció - 2NF. Egy INF relációs séma 2NF alakú, ha benne minden másod- 
lagos attribútum a séma bármely kulcsától teljesen függ. 





Más szavakkal: másodlagos attribútum nem függ egyetlen kulcs egyetlen valódi 
részhalmazától (részkulcstól) sem. 


A 2NFT definíciójának céljn már nyilvánvalóan a redundancincsökkentés. Ha ugyan- 
is megsértjük a 2NF definícióját, és lehetővé tesszük másodlagos attribútumnak 
részkulcstól való függését is, akkor ebben a másodlagos attribútumbnn az attri- 
bútumértékek redundáns tárolása megvalósulhat, nmint azt nz olábbi pékla szern- 
Jélteti. 


Példa. Az MRA, B,C,D) atomi attribútumokat tarinlmnzó séma az F — (4B- 
€,8B 5 D) függéshalmaz mellett 1NF-ben van, ugyanis egyetlen kulcsa AB, el- 
södleges attribútumai A és B, másodlagos attribútumai € 63 D. A D attribútum 
a B 5 D függés miatt az AZ kulcs részétő! is függ, tehát nem lehet 2NF-ben. Az 
(ft, F) sémára illeszkedik pl. a 





reláció, amely a D attribútumban redundáns tárolást valósít meg a 3 — D függés 
következtében. 


A definíció közvetlen következményei: 


- Ha minden kulcs egyszerű, akkor INF - 2NF. 
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- Ha nincsenek másodlagos attribútumok, akkor INF 5 2XF. 


Tétel. Minden INF relációs séma felbontható 2NF sémákba úgy, hogy azok fel- 
használásával az INF sémára illesztett, seredeti" relációk helyreállíthatók (tor- 


zulás nélkül, Id. a veszteségmentes sérnafelbontásról szóló 9.2.5. alszakaszt). 





Példa. Az 5.2.9. alszakaszban ismertetett feladat relációs sémáinak megterve. 
zéséhez a NAPI HELYZET sémából indulunk ki, amely minden attribútumot 
tartalmaz; 


NAPI HELYZETIDÁTUM, ÖSSZEG, ÁRUNÉV, DB, ÁRUKÓD, 
EGYSÉGÁR, BEFI2) 


Ez a sérna INF alakú, mível benne minden attribútum atomi. 


A sémán az alábbi funkcionális függőségeket definiáljuk (amelyek a valóságos vi. 
szonyokkal is jó összhangban vannak): 


- ÁRUKÓD a ÁRUNÉV, EGYSÉGÁR (az áru kódja meghatározza az áru 
nevét és egységárát) 

- DÁTUM, ÁRUKÓD — DB (minden nap minden árucikkből meghatározott 
darabszámút adtak el) 

- DÁTUM -s: ÖSSZEG, BEFIZ (minden nap egy jól meghatározott összeget 
visznek a bankba) 

a ÖSSZEG a DEFIZ(a BEFIZ - ÖSSZEG 4000 törvényszerűség összekap- 
csolja BEFIZ és ÖSSZEG egy-egy értékét) 

- BEFIZ-5 ÖSSZEG 


Más funkcionális függőséget nem definiálunk. 


Láthatóan a NAPI HELYZET egy kulcsa a (DÁTUM, ÁRUKÓD) attribútum- 
halmaz, amely összetett kulcs. Nem nyilvánvaló ugyan, de a relációnak ez az egy 
kulcsa van. 


- Elsődleges attribútumok: DÁTUM, ÁRUKÓD 
- Másodlagos attribútumok: DB, ÖSSZEG, BEFIZ, ÁRUNÉV, EGYSÉGÁR 


A NAPI HELYZET séma nincsen 2NF-ben, mert pl. a DÁTUM -: ÖSSZEG, 
BEFIZ függöség miatt van olyan attribútum (pl. ÖSSZEG), amelyet már a kulcs 
égy része ís meghatároz (DÁTUM). 


Bontsuk fel ezért a NAPI HELYZET-et több sémára az alábbiak szerint: 


- ÁRUÁRUKÓD, ÁRUNÉV, EGYSÉGÁR) 
- MENNYISÉGIDÁTUM, ÁRUKÓD, DB) 
- BEVÉTELIL(DÁTUM, ÖSSZEG, BEFIZ) 


Ahhoz, hogy ezen sémák normálformáíról mondhassunk valamit, szükségünk van a 


140 


sémákon értelmezett függőségekre. (Ehhez részletesen Id. a vetített függőségekről 
szóló részt a 9.2.6. alszakaszban). Itt csak a végeredményt közöljük: 
- Fány 7 (ÁRUKÓD - ÁRUNÉV, EGYSÉGÁR) 
- FugengyiséG 7 IDÁTUM, ÁRUKÓD a DB) 
- FREVÉTEL 7 (DÁTUM — (ÖSSZEG, BEFIZ), ÖSSZEG a DEFIZ, 
BEFIZ a ÖSSZEG) 


Könnyen belátható, hogy most már mindhárom relációs séma 2NF-ben van: az 
első és utolsó azért, mert kulcsuk egyszerű kulcs, MENNYISÉG pedíg azért, 
mert DB-t az összetett kulcs egyik valódi része sem határozza meg. 


9.2.4.4. A harmadik normálforma (3NF) 


A definicióhoz szükségünk lesz néhány új fogalomra, 











Definíció - triviális függés (trivial functionat dependency), Ha az X.Y att- 
ribútumhalmazokra igaz, hogy Y C X, akkor az X 6 Y függőséget triviális 
fűüggőségnek nevezzük, egyébként a függőség nemiriviátis, 






Definíció - tranzitív függés (tiransítíve dependency). Adott egy ft séma, a séimán 
értelmezett funkcionális függőségek F halmaza, X C R,A € ft. A tranzítívan 
függ X-től, hh 3Y CR, hogy XA YY AAY OG AGSARY. 


Példa. Adott R(Járat, Dátum, Pilótakód, Név) z R(J, D.P, N), 
Fz(JDOAP.PONNOP). 


Az N attribútum tranzitívan függ JD-Aől, mert ID 0 PP b JD Pa N és 
nyilván W £ P az egyszerű attribútumok miott. 







Definíció - 93WF, definíció 1. Egy INF R séma 3NF, hn VA € R másodlagos 
attribútum és VX C R kulcs esetén $Y, hgy XA Y YÁXY A A (ts 
AGY. 


Szavakkal: ha egyetlen másodlagos attribútuma sein függ tranzitívan egyetlen 
kulcstól sem. 


Definíció - 3NF, definíció 2. Egy INF ft séma 3NF,hayX 6 AXER 
A € R nemtcriviális függőség esetén 


- X szuperkulcs vagy 
- A elsődleges attribútum. 
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A 3NXNF első definíciója szemléletesebb, ha n redundanciacsökkentést tartjuk szem 
előtt. Felesleges ugyanis egyazon relációban tárolni az X,Y, A attribútumokat. 
Hiszen minden olyan sorban, amelyben X és Y értékeit rendeljük egymáshoz, 
meg kell adnunk A értékét is, amelyek azonosak kell, hogy legyenek minden olyan 
sorban, amelyben Y értéke azonos. Márpedig Y értéke azonos lehet különböző X 
értékekre is. Ilyenkor az Y — A függőségnek megfelelő (y, a) értékeket többszörö- 
sen tároljuk, nyilvánvaló redundanciát ,építve" a relációba. 

Egyes szerzők jobban kedvelik a 3XF második definícióját, talán azért, mert gyak- 
ran könnyebben ellenőrízhető ebben a formában, hogy egy séma teljesíti-e a 3NF 
kritériumnit. A definíció szemléletes tartalma ugyanakkor ezesetben már nem nyil- 
vánvaló. 


Tétel. Def, 1. 5 Def. 2. 


Bizonyítás. Előre; Dcf. 1. 5. Def. 2. 


Indirekt: Def. 1. feltételei mellett t. f. h. 3Z 5 B nemtriviális függőség, ahol Z 
ném szuperkuülcs, és B nem elsődleges attribútum. 

Viszont minden relációs sémának létezik kulcsa, legyen ez X. Igaz tehát, hogy 
XoOZZ A X tkülönbten Z szuperkuülcs lenne), Z — B,B £ Z (különben 
Z c B tiiviális függőség lenne). Ez pedig éppen égy másodlagos attribútum 
kulcstól való tranzitív függése, ellentmondásban Def. 1. feltételeivel, 

Tehát Def. 1. 5 Def. 2. 

Vissznfelé; Def, 2. 5 Def, 1. 

Indirekt: Def. 2. feltételei mellett t. £.h.3y €C R,3X kulcs és 3A másodlagos 
attribútum, hogy MO YY AA Y OO AGSALYAX GY, mivel X kulcs, 
ezétt nincs ellentmondásban Def. 2-vel, Y A X, tehát Y nem lehet szuperkulcs, 
YG AG ALY miatt tehát létezik egy nemtriviális függőség, melyben Y nem 
szuperkulcs, 24 nem elsődleges attribútum, ellentmondásban Def. 2. feltételeivel. 


Tehát Def. 2. s Def. 1. 


Megjegyzés. A definíció szerint minden F$Y.beli függőségen ellenőrizni kellene 
6 feltételt. 


Tétel. Ahhoz, hogy egy (R, F) sémáról (Def. 2. alkalmazásával) eldöntsük, hogy 
3NF-e, elég az F-beli funkcionális függőségek vizsgálata. (Nem bizonyítjuk.) 
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Tétel. Minden legalább INF relációs séma felbontható 3XF sémúkbn úgy, hogy 
azokból az eredeti reláció információveszteség nélkül helyreállíthntó. 


Bizonyítás. Ld. 9.2.7. alszakasz: veszteségmentes dekompozíció 3$F-be, 





Példa. Az előző szakasz ÁRU, MENNYISÉG és BEVÉTEL relációs séműít vizs- 
gáljuk meg, hogy teljesítik-e a 3NF kritériumait: 


Az ÁRUTÁRUKÓD, ÁRUNÉV, EGYSÉGÁR) séma nemtriviális függősége csupán 
ÁRUKÓD —a ÁRUNÉV, EGYSÉGÁR, tehát ÁRUKÓD kulcs, így ÁRU 3NP ala. 
kú. 

A MENNYISÉG(DÁTUM, ÁRUKÓD, DB) séma egyetlen nemtriviális függősége 
DÁTUM, ÁRUKÓD — DB, tehát (DÁTUM, ÁRUKÓD) kulcs, így MENNYISÉG 
is 3NF alakú. 

A BEVÉTEI(DÁTUM, ÖSSZEG, BEFIZ2) séma nemtriviális függőségei: 


- DÁTUM 5 ÖSSZEG, BEFIZ 
- ÖSSZEG a BEFIZ 
- BEFIZ a ÖSSZEG 


A BEVÉTEL egyetlen kulcsa tehát DÁTUM, másodlagos attribútumni ÖSSZEG 
és BEFIZ. Az utóbbi két függőségben n determináns nem szuperkulcs, és az 
sem teljesül, hogy ilyenkor a függőségek jobb oldalán elsődleges attribútum Állt. 
BEVÉTEL így nem 3NF alakú. Bontsuk fel ezért az alábbi formában: 


- BEVÉTDÁTUM, ÖSSZEG) 
- BEFIZ(DÁTUM, BEFIZETÉS) 


Könnyen belátható, hogy mindkettő 3NF alakút, 


Tétel. Ha cgy síma 3NF alakú, akkor 2NF is egyben. 


Megjegyzés. Az A. függelékben definiált implikáció műveletével ezt így ís 1mmeg- 
fogalmazhatjuk: 3NF(R) — 2NF(R). 


Bizonyítás. Indirekt. T. í. h. az R séma nem 2NE, ekkor ellentmondásra kell 
jutnunk a 3NF definíciójával (azaz —2NF(R) — -3NF(R)). Ezzel ekvivalens, hin 
belátjuk azt, hogy másodlagos attribútum részkulcstól való függéséből következik 
kulcstól való tranzitív függése. 


Legyen A € R másodlagos attribútum, IC egy kulcs, amelyekre K — A, továbbá 
3K" € K, hogy KI — A is igaz. K" b K, hiszen ekkor KC nem lenne minitnális, 





$ Noha cz egy jó megoldás, Je a felbontás nem függöségörző (tu. később). Ia viszont az egyik 
sérmát ÖSSZEG, BEFIZETÉS: re cseréljük, akkor függöségürző ís Icsz. 
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tehát nem lehetne kulcs. Továbbá A $ X, mert A másodlagos attribútum, tehát 
egyetlen kulcsnak sem lehet eleme, Tehát: Ka KK BKK OAAg 
K", ami éppen azt jelenti, hogy az A attribútum tranzitívan függ a K kulcstól, 
ellentmondásban a 3XF definíciójával. 


A bizonyításból az is következik, hogy egy másodlagos attribútum részleges (üg- 
égése kulcstól egyúttal a másodlagos attribútum tranzitív függését is jelenti a 
kulcstól. 3 j 





9.2.4.5. A Boycc-Codd normálforma (BCNF) 


Vegyük észre, hogy a 3NF definíciója csak a másodlagos attribútumok kulcstól 
való tranzitív függését zárja ki. Lehetséges tehát elsődleges attribútum kulcstól 
való tranzitív függése 3XF sémákban. Ez viszont azt jelenti, hogy - a már ismert 
okfejtést követve — a 3NF relációk is tartalmazhatnak még redundanciát. Indokolt 
tehát további normálforma, n Boyce-Codd normálforma (BCNF) bevezetése, Be 
fogjuk látni, hogy a BCNF sémákra illeszkedő relációk már mentesek a funkcionális 
függés-alapú redundanciától. 


Definíció - BCNPF, definíció 1. Egy INF ft séma BCNF, ha vA € f attribútum 
és VX CR kulcs esetén jY, hogy XGY.YÉXY HG AGSAPY. 


Szavakkal: egyáltalán nincs tranzitív függőség kulcstól. 





Definíció - BCNF, definíció 2. Egy INF R séma BENE, ha VX — A.X CC 
RA € R nemtriviális függőség csetén X szuperkulcs. 


Vegyük észre, hogy minden séma, amely legfeljebb két attribútumot tartalmaz, 
törvényszerűcn BCNF. 


Tétel. Def. 1. 6 Def. 2. 


Bizonyítás. Ilasonló a 3NF definícióinál leírtakhoz. 
Előre: Def. 1. 5 Def. 2. 


Indírekt: Def. 1. feltételei mellett t. f. h. 37 5 B nemtriviális függőség, hogy Z 
nem szuperkulcs. 


Viszont minden relációs sémának létezik kulcsa, legyen X ezek közül egy. Igaz 
tehát, hogy XAZZ4XZ5BBgEZ. Ez pedig éppen a B attribútum X 
kulcstól való tranzitív függése, ellentmondásban Def. 1. feltételeivel. 


Tehát Def. 1. 52 Def. 2. 
Visszafelé: Def. 2. 5 Def. 1. 
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Indirekt: Def. 2. feltételei mellett t. £. h. 3JY € R,3X kulcs és 3A attribútum, 
hogy XA FRYÁAÁRXYO Aés AGY 


X 6 Y: mivel X kulcs, ezért nincs ellentmondásban Def. 2-vel, Y.46 X, tehát 
Y nem lehet szuperkülés, 


Yo Aés AY miott tehát létezik egy nemtriviális függőség, melyben Y nem 
szuperkulcs, ellentmondásban Def. 2. feltételeivel. 


Tehát Def. 2. - Def. 1. 


Tétel. Ahhoz, hogy egy (ft, F) sémáról (Def. 2. alkalmazásával) eldöntsük, hogy 
DCNTF-e, elég az F-beli funkcionális függőségek vizsgálata. (Nem bizonyítjuk.) 





Példa. Az előző szakasz ÁRU, MENNYISÉG, BEVÉT, BEFIZsémái mind BCNF 
alakúak, ami a definíció alapján könnyen ellenőrizhető. 






Tétel. Ha egy séma BCNF alakú, akkor 3NF is, 


Bizonyítás. A két definíció közvetlen következménye. 





Tétel. A BCNF sémákra illeszkedő relációk nem tartalmaznak redundanciát 
(legalábbis funkcionális függőségek következtében). 


Következmény, Emiatt egyetlen attribútum értékét sem lehet kikövetkeztetni 
más attribútumok értékeinek ismeretében, ismert funkcionális függöség alapján. 


Bizonyítás. Jadírekt. T. f. h. na séma BCNF, de mégis van egy rá illeszkedő 
relációban redundancia. Ez nzt jelenti, hogy van benne olyan két sor, t és €, 
hogy egy A attribútum értékét a £ sor értékei és a sémán értelmezett funkcionális 
függőségek alapján a €" sorban nem írhatjuk be tetszölegesen, és Y ráadásul nem 
üres, Vizsgáljuk meg az alábbi relációt: 





Az X és az Y attribútumbalmazokat jelölje ki az, hogy t és €-ben az X értékei 
mind azonosak, míg léteznek olyan attribútumok is, amelyek £-n és t-n külön. 
böznek. Ez utóbbiak az Y attribútumok, tehát yl £ 12. T. f. h. az attribútumok 
között definiált függőségi kapcsolatok miatt a ? helyére kötelezően a-t kell Írnunk, 
Ez azt jelenti, hogy léteznie kell egy Z — A függőségnek, ahol nyilván Z € X. 
Viszont Z nem lehet szuperkulcs, mert akkor a £ és € soroknak azonosaknak 
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kellene Jenniük, ami ellentmond annak a feltételezésnek, hogy y1 sé 42. Ha pedig 


Z nem szuperkulcs, akkor a Z — A függőség ellentmond a BCNF definíciójának. 





A normálforma definíciókból és a viíszonyukból az következik, hogy egy reláció 
redundanciáját (funkcionális függések következtében) az okozhatja, ha az attri. 
bútumnai tranzíthan függenek a kulcs(ok)tól. A 3NF a másodlagos attribútumok 
tranzitív (és egyúttal részleges) függését zárja ki, a BCNF pedig az elsődleges 
oltribútumokét is. 


Ez és az előző tétel tehát azt sugallja, hogy a relációs adatbázisok tervezése s0- 
rán célszerű BCNF sémákat kialakítani. Hiszen ekkor - ha az attribútumaink 
között csak funkcionális függőségekkel leírható függőségi kapcsolatok vannak - 
n relációink redundanciamentesek lesznek, ami lényegesen megkönnyíti az egyes 
relációk (táblák) tortalmának módosítását végző alkalmazások megírását, ill, a 
hatékonyság biztosítását, Tegyük fel ugyanis, hogy nem bízhatunk a redundancia- 
mentességben: ekkor minden egyes érték bevitele előtt ellenőrizni kellíene), hogy a 
relációban már meglévő elemek és nz új elem együttesen nincs-e ellentmondásban 
valamely ismert kényszerrel (jelen csetben funkcionális függőséggel). Az ellenőrzés 
ugyan elvégeztethető egy adatbázis alkalmazással, kliens oldalon vagy magával 
az adatbázis-kezelő rendszerrel is, de bármelyik ís igen költséges lehet, különö- 
sen, ahogy egyre nagyobb mennyiségű adatot szeretnénk kezelni. Ezzel szemben 
BCNF sémák esetén elég csak n kulcsattribútumok értékeinek egyediségét bíztos[- 
inni (ami pl. indexeléssel hntékonyan támogatható is), a többi attribútum értékét 
már tetszőlegesen vihetjük be a relációba. A redundancia minél alacsonyabb szin- 
ten tartásn tehát kritikus nz ún. tranzakciókezelő (manapság leginkább on-line 
tranzakciókezelő, OLTP) rendszereknél." Ennek típikus példái n repülőtéri hely- 
foglaló rendszer, banki átutalásokat végző rendszerek vagy éppen egy hailgatói 
tanulmányi rendszer (pl. Neptun). 


A valóság ezzel szemben az, hogy még további szempontok ís léteznek a relációs 
sémntervezésnél és a relációs adatbázisok üzemeltetésénél, amelyeket - bár még 
nem ismerünk — majd ügyelembe kell vennünk. Emiatt nem lesz mód arra, hogy 
mindig BCNF sémákat alakítsunk ki. 


A gyakorlatban ritkán dolgozunk egyetlen sémával, így esetenként egész sor, egy 
adolt adatbázishoz tartozó sémáról kell megállapítani, hogy milyen normálformá- 
ban található. Nem meglepő módon: 


Definíció. Egy adatbázis BCNF (3NF, 2NF, INF) alakú, ha a benne található 





összes relációs séma rendre legalább BCNF (3NF, 2NF, INF). 


$ Az OLTP rendszerekkel szemben az ún. döntéstámogató rendszerekre (decision support 8y5- 
tem, DSS) viszont a ritkán módosuló adatok, nagy tömegű, bonyolult és változatos lekér- 
dezések jellemzőek. Ilyen esetekben 6 Ickérdezés sebességére kel) optimalizálni, és emiatt kí- 
fejezetten ellenjavallt lehet a normalizált sémák alkalmazása. Ld. analitikus alkalmazások, 
dimenziós modellezés, adattárházak. 
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9.2.5. Veszteségmentes sémafelbontás (lossless schcma 
decomposíition) 





Definíció - sémalelbontás (sckema decomposítion]. Egy ft relációs sémánnk 
elt, 2... Rh) egy felbontása, hh RYUR2U...UR,7 ft . 


A felbontás célja általában az, hogy czáltot a részsémák valnimely magasabb nor- 
málformába kerüljenek. Egy séma felbontásávni nyilván a sémára illeszkedő reláci- 
ók ís felbomtanak. Itt azonban körültekintően kej) eljármink, mert egy reláció öt- 
letszerű felbontásakor információt is veszíthetünk. Ez abban nyilvánul meg, hogy 
később nem tudjuk a részrelációkból (azaz a részsémákra vetített relációkból) az 
eredeti relációt — és ezzel együtt annak eredeti információtartalmát — helyreállíta- 
ni. A helyreállítás itt n részrelációk természetes illesztését jelenti, ha ez nem adjn 
visszn az eredetit, akkor más mód nincsen rá. 


Példa. Legyen az R(A, B,C) sémán egyetlen funkcionális függőség értelmezve: 
€ a A. Vizsgáljuk meg a a(4B, BC) és a p2( AC, BC) felbontásokat nz alábbi 
reláción: 


R(A, B,C) R(A, B) R(BO) 
AlB B]c 
alec ecle 
ald a] ír 
bíc cÍíÍg 
bíd díh 





Alc B8]C 
ale cl[e 
ali dít( 
bíg cÍg 
bíh dÍh 


Láthatóan R" 4 R, miközben R" — R . Tehát az R -höz tartozó pp felbontásnnk 
gyakorlati haszna aligha van, hiszen a felbontás következtében az eredeti relációt 
többé nem tudjuk helyreállítani. Mivel ezzel információt veszítettünk, ezért ezt 
úgy fejezzük ki, hogy pi veszteséges. A pz felbontás viszont használható lehet, hn 
bebizonyosodik, hogy minden r(ft, F) esetén hasonlóan viselkedik. Utóbbi esetben 
£2-re azt mondjuk, hogy veszteségmentes. 
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Tanutság. Amikor relációs adatbázis sémákat tervezünk, nem elegendő csupán 
a minél magasabb normálformára, azaz minél kevesebb redundanciára törekedni. 
Egyidejűleg a veszteségmentesség biztosítása feltétlen követelmény, hiszen sem- 
mit som ér egy kevés redundanciát tartalmazó adatbázis, amelyből a modellezett 
valósággal nem összhangban levő, ill. annak ellentmondó adatokat /információt is 
ki lehet olvasni! 





Definfció - project-join mapping (pruject-jotn mapping]). Legyen az R relációs 
séma p felbontása mellett mo (r) z rk, (r) HM 7p, (r) P1... Map, (r) (project- 
join mopping). 








Definíció — veszteségmentes sémafelbontás (iossless schema decomposítion). Az 
R relációs séma egy p(R1, R2, . . . , Rn) felbontását veszteségmentesnek mondjuk, 
ha vr(t) matr) sr. 


Tétel. Adott egy ft séma és egy pit, Ra, . .., Rn) felbontása. vr(f) relációra 
r€ mhír) 


Bizonyítás. Vegyünk egy tetszőleges t € r sort. Képezzük t vetületeit az R; 
részsémákra, legyen cz t[R;], amely nyilván eleme az f-edik részrelációnak. Ez 
a vetület nem változik m,(r) -ben sem, és n természetes illesztés tulajdonságai 
miatt 3, (r) valamelyik sorában mindegyik t (R), £ — (1,...,n) meg fog jelenni. 
Így t € mo(r) . 

A tétel állítása más szavakkal: tetszőleges (tehát nemcsak veszteségmentes!) fel- 


bontás után a természetes illesztés eredményeképpen sorok nem tűnhetnek el, 
csak újak keletkezhetnek. 


Tétel. Adott egy R síma és ft-nek egy (ft, Ít2, ... , Rn) veszteségmentes fel- 
bontása. Legyen o(S1, 52... 19m) valamely AR; € p részsémának szintén veszte- 
ségmentes felbontása. 
Ekkor a ríifti, R2,.... Ronan. nSn 5215) R-nek szintén veszte- 
ségmentes felbontásn. 


Bizonyítás, A join asszociativitását kihasználva triviális. 





Tétel. Adott egy f séma és R-nek egy 9(f1, ft2, . . . , Rn) veszteségmentes fel- 
bontása. Tetszőleges T J o esetén T ís veszteségmentes. 


Bizonyítás. Ismét a join asszociativitását használjuk fel. 7 veszteségmentes, 
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ha Vr(R) relációra r — me(r). me(r) z mp(r) A rpey (Tr) PR re (r) BA... PA 
zRm (r), ahol Rk, R,.... Rm €T, de gp . Készítsük el ezért mp (r)-et, melyre 
nyilván m,(r) — r. Vegyünk ezután egy olyan ft; sémát, melyre ft; € T, de 
R; £ p. Képczzűk mo (ír) MW rn. (r)-t. Mivel mo (r) — r, ezért mp(r) Mr, (r) E 
ri zg (r) s r. Emiatt mp fö 14 zp,. (r) ha AR (r)ba... ta zgpn (r) —r, tehát 


mr (r) —r, azaz T veszteségmentes. 





Tudjuk most már, hogy vannak ,jó" és ,rossz" sémafelbontások, de egyáltalán 
nem világos, hogy ennek az oka a reláció elemeiben vagy a séma szerkezetében 
(értsd: n sémán értelmezett függöségek rendszerében) keresendő. Konkrét csetben 
természetesen mindig kipróbálható, hogy egy felbontás melyik kategóriába csik 
- mint a fenti példában -, sématervezéskor azonban ez n megközelítés nyilván 
használhatatlan, hiszen tervezési időben nem ismerhetjük n sémára a jövöben 
illeszkedő példányokat. 


Szerencsére erre nincs szükség, megmutatható, hogy egy felbontás veszteségmen- 
tessége vagy veszteségessége kizárólag a relációs sémán és a sémán értelmezett 
függöségeken múlik, Természetesen ez csak akkor igaz, ha n reláció elemei nin- 
csenek ellentmondásban a sémán értelmezett függöségekkel! Ebben az esetben a 
séma vizsgálata választ ad egy felbontás veszteségességére. Érre szolgál a követ- 
kező tétel. 


Tétel. Adott az R sérna, a séma attribútumain értelmezett F függöséghalmnaz 
és egy p(fti. R2) felbontás. p veszteségmentes 5 (MON Ra) 5 (mm R)e FT 
vagy (NR) A (tet) e FT. 


Bizonyítás, Visszafelé: Azt akarjuk belátni (RiNn.R) A (MÁARJEET vagy 
(RNI) 5 (RAM) E FT alapján, hogy tetszőleges í € ry 4 rg egyúttal r-nek 
is eleme. 


Biztos, hogy Jsi € r, hogy si(fti) — t(Ri] (pontozás), továbbá 352 € r, hogy 
sa(Ro) — tÍR2] (szaggatott vonal). 
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Tudjuk továbbá, hogy t(fta.N.R2) — salRi N Ra) — self NR]. 

T. (. h. a kétféle lehetőség közül (Ry 0 fta) a (RA R2) áll fenn, amely szerint, 
ha 

sal n Ra] — solít NR), akkor kötelezően sií(Ri 4 Raj — self § Ae). Emiatt 
— mint a fenti ábrán is látható - s2 — t, azaz megtaláltuk azt az r-beli sort, 
amelyik egy tetszőleges t € ry PA rg -vel megegyezik. 


Előre: Indirekt módon bizonyítjuk. T. f. h. sem (RY1.R2) a (RRt) € Ft sem 
(RON R) a (RAM) E FT nem áll fenn. Ekkor ellentmondásra kell jutnunk 
a feltétellet. Ehhez elegendő egyetlen olyan, az adott sémára és függőségekre 
illeszkedő relációt találni, amely veszteségesen bontható fel. 


Az alábbi ábrán látható reláció ilyen tulajdonságú. 


MERNRY(E) 


Látható, hogy sem (Ry.N 2) — (RV Ra) sem (fa NR) 5 (R2 VR) nem 
áll fenn. Azt kell még belátni, hogy kielégíti F minden függőségét. Valamely 
V-WV e F.re: 


- ha V kilóg" (ft). N Ra)Y-ből, akkor nincs két azonos sor, tehát V 2 IV 
teljesül bármely WV-re. 

- ha V. E (MNRO)T, akkor (RINR2) 6 Vés VO TV miatt (R1NR2) 5 WV, 
melynek feltétele, hogy W C(f.NRO)T. Így WV értékei is azonosak, tehát 
V 5 W ekkor is teljesül. 


Utolsó lépésként ellenőrizhető, hogy Try M4 r2 5 r, tehát a felbontás valóban 
veszteséges. 





Példa. Tekintsük újra a 9.2.5. alszakaszban szereplő R(A, B, C) sémát, amelynek 
F függéshalmaza csak a C — A függőséget tartalmazza. Vizsgáljuk meg rendre a 
pi (AB, BC) és a p2( AC, BC) felbontásokat a fenti tétel alapján! 
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Pu: 
ABNBC z BABY BO — A BO AgFT, hiszen nyilván nem következik 
C a A-ból. 

ABONBC z B.BCYAB —- CB C g FT, hiszen nyilván nem következik 
C a A-ból. 

Tehát pi veszteséges. 

92: 

ACNBC 5 C.ACNBOC- A CG AEFT ínyilvánvaló), tehát pz veszteségmen- 
tes. 

(ACNBCz OC BOYAC BOCA BEFT) 








Megjegyzés, A tételt arra is felhasználhatjuk, hogy segítségével veszteségmen- 
tes felbontásokat készítsünk p(fti, 2) formába. Ehhez bármly XGaGYEF 
nemtririális (vagy akár X 5. Y € F?) függés alapján, ahol X és Y diszjunktak, 
legyen 

- R- XY, At. 

- 25 RNY. 


Könnyen ellenőrizhető, hogy ekkor az (R,N Ro) 5 (Rp) R2) pontosan X GY 
formában fog teljesülni, azaz p veszteségmentes lesz. 


Tétel, Adott R(XYZ) és funkcionális függőségek F halmaza csetén, ahol X,Y és 
Z (páronként diszjunkt) attribútumhalmazok, n A(XY, XZ) felbontás pontosan 


akkor veszteségmentes hah XGYEFYt vagy XOZEFT. 


Bizonyítás. Az előző tétel közvetlen következménye. 





Az előző tételek tatékony analízis és térvezési módszert adtnk arra, hogyan lehet 
egy sémút veszteségmentesen két részre bontani. Az alábbi módszer tetszőleges 
számú részre bontott részséimáról lehetővé teszi a veszteségmentesség eldüntését. 
Adott egy R(A1, A2....5Ak) séma, a sémán értelmezett F függőségek és A-nek 
egy p(fti, ft2,..., Rn) felbontása. Táblázatot készítünk n sorral és k oszloppal, 
Az oszlopokat a séma attribútumainak, a sorait a részsémáknak feleltetjük meg. 
Kiindulási állapotként úgy töltjük ki a táblázatot, hogy az í-cdik sor 3-cdik osz- 
lopába 


- a-t írunk, ha A; € R;, 
— b;-t írunk, ha A; £ HR. 


Ezután mindaddig módosítjuk a táblázat elemeit az F függőségeínek figyelembe 
vételével, az alábbiak szerint, ameddig a táblázat változik; 
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Vegyük egy tetszőleges X GY € F függést. Ha létezik két olyan sor a táblázat- 
ban, amely X-en azonos, akkor Y-on ís egyenlővé tesszük őket, mégpedig 


- ha valahol a-t találunk, akkor a másik sor azonos oszlopának eleme is legyen 
a, 
- ha nem a egyik sem, akkor b;-t. és bj-t tegyük egyenlővé tetszőlegesen. 


Példa. Legyen R(S,A,I,P), F - (5-5 A,SI5 P,P— S). P(SA, SI, IP, PS). 


Kezdőállapot: Végállapot: 


Tétel. A felbontás veszteségmentes 6 van csupa a-ból álló sor. 


Bizonyítás. Élőre: 
A táblázatot tekintsük olyan rí?) relációnak, ahol a-kat és b;-ket DOM(A5)-ből 


választottuk, A végállapotban r kielégíti F összes függőségét, hiszen az algorít- 
mus pontosan az F-beli függőségek sértéseit korrigálja. Bontsuk fel r-et íg 5-nak 
megfelelően, ekkor n táblázat kezdőállapotának konstrukciója miatt ígaz, hogy 
7, (r)-ben lesz olyan sor, amely csupn a-ból áll, minden i-re. Tekintve, hogy 
me(r) szk, (r) H mp (r) X... HM mpn ír). Így mo(r) -ben biztosan keletkezik 
olyan sor, nmely csak a-kat tartalmaz. Ha p veszteségmentes, akkor mp (r) —r, 
minden r-re, tehát a végállapotbeli táblázat 5 mo (r), azaz tartalmazza a csupa 
a-ból álló sort. 


Visszafelé: nem bizonyítjuk. 





9.2.6. Függőségörző felbontások 


Vizsgáljuk meg a következő példát! Adott az R(VÁROS, ÚT, IR SZÁM) z 
R(V, ÜST) séma, amelyen - a valósággal jó összhangban - az F 5 ÍV 5 I, 
I a V) függőségeket értelmeztük. Készítsük el a séma p(UI, VI) felbontását! 
(Könnyen ellenőrízhető az előző tétel segítségével, hogy 9 veszteségmentes, te- 
hát tetszőleges, (R, F)-re illeszkedő r reláció esetén r helyreállítható természetes 
illesztéssel a részsémákra vonatkozó vetületeiből.) 


Példa. Egy adatrögzítő az ennek alapján készített adatbázisba az alábbi adatokat 


vitte be: 
Ti 72 
ÚT TIIR SZÁM VÁROS Í IR SZÁM 
Kossutb Í 2142 Baja 2142 
Kossuth [ 2144 Baja 2144 
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Helyreállítva az eredeti relációt az alábbi sorokat kapjuk: 


ritir2 
ÚT IR SZÁM I VÁROS 
Kossuth 





Az eredménnyel az a probléma, hogy nyilvánvalóan nincs összhangban n feltéte- 
lezett VU — ! függőséggel, amely szerint a valóságunk ,működik", tehát nzzn], 
hogy egy városban egy utcának csak egyetlen irányítószáma lehet. A részrelációk 
természetes illesztése ,hamis" ercdményre vezetett. A hiba azonban nem az ál- 
lesztésnél van, hiszen a felbontás veszteségmentes, tehát az ,eredeti" relációt kell 
visszakapnunk. A valódi ok az, hogy nem ís létezett ,eredeti" reláció, azaz nem 
tudunk olyan r relációt konstruálni, amely illeszkedik (ft, F)-re, és ugyanakkor a 
fenti ry és r2 vetületei lennének. 


Egy ajó" felbontás esetén biztosak akarunk lenni abban, hogy ha a részrelációkba 
csak szemantikailag helyes (adott csetben tehát a felvett funkcionális függéseknek 
megfelelő) adatok kerülnek belc, akkor a relációk valamely illesztése eredménye 
ként sem fogunk majd az adatbázisból olyan sorokat kiolvasni, simelyek a felvett 
- €s az adatok jelentését valamilyen szinten leíró - funkcionális függéseknek el- 
jentmondanak. 


Másrészt mindaddig, amíg a séma egyben van, minden egyes sor bevitele előtt 
elvileg lehetőség van széleskörűen ellenőrizni, hogy a bevitt adatok bizonyos kény- 
szerfeltételeknek (integrity constraints) megfelelnek-e. Ilyenek lehetnek pl. meg- 
határozott függöségi feltételek is. Sajnos, amint nz R sémát felbontottuk, már 
nem feltétlenül tudjuk nz eredeti függőségekct alkalmazni a részrelációkban an- 
nak elkerülésére, hogy ,bamis" adatok kerüljenek be az ndatbázisba, legfeljebb a 
függőségeknek na részsérmákra való vetületeit". Éz egyes esetekben elegendő lehet 
(ezt részesítjük előnyben), más csetekben pedig nem. 








Definíció - vetített függéshalmaz (projccted dependency sct), Adott az ft sétna 
attribútumnin értelmezett függőségek F halmozn. A fűggőségeknekegyyz e R 
attribútumhatmazra való vetítése az a xz (F) függöséghalmaz, nmelyre rz (FF) s 
(XoaYrixoYertésxYcZ) 





Fontos, hogy a vetített függőségholmazban benne legyen minden olyan függés, 
amely F-ből következik, ill. levezethető. 

Példa. Egy R(A, B, C) sémán értelmezett F s (A 5 D, B — C) függöséghalmnaz 
esetén ruc (P) — (45 C), mert a tranzitívitási axióma mitt A a CeFt , 


Ezek a vetített függőségek bizonyos esetekben clegendőek lehetnek a fenti cél- 


jainkra. Ehhez az kell, hogy az ft; részsémákra vetített függőségek ugyanazt oz 
információt hordozzák, mint az eredeti F függéshalmaz. 
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Definíció - függőségőrző felbontás (dependency-preserving decomposítion), 
Adott egy R relációs séma és egy, a sémán értelmezett F függéshalmaz. A séma 
e 5 (f.Ro,..., Rp) felbontása függőségőrző, ha UL irn, (F)E TF. 


Egy relációs séma veszteségmentes, de nem függőségőrző felbontása eredményez- 
heti tehát, hogy a részsémák összességén sem tudjuk többé az eredeti sémában 
érvényes mindegyik függőséget alkalmazni. Ennek következtében a részrelációink 
illesztésével kapott lekérdezési eredményekbe nem megengedett adatok is bekerül- 
hetnek. Ez ellen csak úgy védekezhetnénk, ha minden egyes új sor bevitele elött 
előállítanánk az eredeti relációt, és ellenőriznénk azon a függőségi viszonyok fenn- 
állását. Ez érezhetően nagyon költségessé tenné sok sort tartalmazó relációk esetén 
az új sorok bevítelét, Ezt elkerülendő célszerű tehát olyan sémafelbontásokat készí- 
teni, amelyek függőségörzők. Ebben az esetben ugyanis ha a részrelációkba bevitt 
ndatok valóban megfelelnek a tervezett funkcionális függéseknek (pl. nincs téves 
ndatbevítel), akkor garantálható, hogy a lekérdezések eredményei sem fognak a 
függéseknek (tehát az ndatszemantikának) ellentmondani. 


A definíciókon alapuló kézenfekvő, de nehézkesen alkalmazható lehetőséget nyújt 
egy sémnfelbontás (üggőségőrző tulajdonságának tesztelésére az alábbi algoritmus: 


1. elkészítjük Ft-t, 

2. vetítjük Ft mindegyik függőségét minden részsémára, 

3. meghatározzuk a vetített függőséghalmazok uniójának lezárását, 

4. ha ez azonos Ft-tal, akkor a felbontás függőségörző, ellenkező csetben bíz- 
tosan nem az. 





Megjegyzés. Egy felbontás lehet 
— veszteségmentes és függőségőrző, 
- veszteségmentes és nem függőségörző, 
- veszteséges és függőségörző, 
— veszteséges és nem függöségőrző. 


9.2.7. Sémadekompozíció adott normálformába 


Az előzőek alapján belátható, hogy gyakorlati szempontból az olyan sémafelbon- 
tások bírnak jelentőséggel, amelyeknél biztosítható, hogy az eljárás eredménye 
meghatározott tulajdonságokat mutató sémák halmaza lesz. A legfontosabb tu- 
lajdonságok, amelyeket figyelembe kell venni (nem feltétlenül fontossági sorrend- 
ben): 


- adott normálforma elérése, 
- veszteségmentesség, 
- függőségőrző tulajdonság. 
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Adott tulajdonságú felbontások létezését állítják na következő tételek: 


Tétel. Minden ft relációs séma és a sémán értelmezett F függéshahnaz esetén 
3p sémafelbontás, amely veszteségmentes és lüggőségőrző, továbbá vft; € p-ra 
Mt; 3NF tulajdonságú. 


Bizonyítás. Konstruktív. Képezzük az adott föggéshalmaz egy minimális fedé- 
sét, legyen ez G. Ha G — (Xg 5 41X2 9 Azon 79 An) alakú, akkor a 
felbontás legyen 9(X1An X242)...rXnAn, 16), ahol K az f séma egy kulcsa. 


A p felbontás természetesen függőségőrző, mert a részsémákrn vetített függösé- 
gek közül egy pontosan megegyezik az egyik 6-beli függőséggel, így a vetített 
függőségek lezártja nyilván megegyezik G lezártjával. 


A 3NF tulajdonságot indirekt módon bizonyítjuk. T.f£.h.3Y 2 BEGTYBE 
X;Ai valamely í-re, amely az í-edik séma 3NF tulajdonságát sérti; azaz B£Y, 
Y nem szuperkulcsa R;-nek és B nem elsődleges attribútum. 


- Ha B — A;, akkor Y GC X; és mivet Y nem szuperkulcsa X;A;-nak, így 
Y c X;. De ekkor a feltételezett Y — B miatt Y — A; ugyanazt fejezi 
ki, mint X; -r A; így G-ben X; — A; helyett Y — Aj-nek kellett volna 
szerepelnie. 

- Most t. £. h. B A A;. Mivel XA; szuperkulcs X;As-ben, ezért 37 C X;, 
amely kulcs. B £ A; miatt B € X;, de B g Z, mert feltételeztük, hogy B 
nem elsődleges attribútum. Így X; feltétlenül bővebb 2-nél legalább D-vel. 
Ekkor viszont az X; 7 4; függőség helyettesíthető G-ben Z — A;rvel. 


Meg kell még vizsgálnunk, hogy n I kulcsként (csetleg) megjelenő n 4 )-edik 
séma is 3NF-e. Ha Y 5 B nemtriviális függés és Y.B € KH, akkor HK nem lelhet 
minimális, hiszen belőle 8 elhagyható. 


Láthatóan mindhárom csetben ellentmondásra jutottunk a feltétellel, az első kct- 
tőben azzal, hogy G minimális függéshalmaz, a barmadikban a 3€ kulcs minimális 
tulajdonságával, Tehát mindegyik részséma 3NF. 


Lássuk be most p veszteségmentességét. Ehhcz a táblázatos tesztet fogjuk hasz- 
nálni. Megmutatjuk, hogy a táblázat végállapotában a K sora csupa a-t tartal- 
maz. 


Képezzük először /Ct.t a tanult algoritmussal, Ennek során rendre a 
Bi, Ba... . , Bx. attribútumokkal bővítjük K (0) — /€-t, ebben a sorrendben. Nyil- 
ván igaz, bogy K U (Bi, B2,....BxY 5 R. Megmutatható, hogy a táblázat mó- 
dosítása során B;-k sorrendjében lehetőségünk van K sorába a-kat Írni, Ezt i-re 
vonatkozó teljes indukcióval láthatjuk be. i — 0 megfelel annak, hogy a K sorá- 
ban a K attribútumainak oszlopaiban a-k vannak. 


T.íf h. i — I-re még működik, majd adjuk hozzá K (0.hez Bi-t valamely 
Y a B; € G függőség miatt. KY konstrukciója miatt biztos, hogy Y C 
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K u (B, B2..... Bi a): Ekkor n táblázatban a K és az Y.B; sémák sorainak 
ottribútumértékei az Y oszlopaiban mind megegyeznek, mégpedig mind a, mert 


- K sorában A attribútumainak oszlopai a táblázat konstrukciója miatt min- 
denkor a-k, Bi, B2..... B; a oszlopai pedig már a-k, 

- Y.8; sorában Y attribútumainak oszlopaiban a táblázat konstrukciója mi- 
att mindenkor a-k állnak. 


Mivel Y.B, sorában B; oszlopában a áll, ezért jogosan írhatunk K sorába B; 
oszlopába is a-t, 





Megjegyzés. 


1. Vegyük észre, hogy a X kulcs csak a veszteségmentes tulajdonság biztosí- 
tásához kell. Ha a sémafeibontásból kihagyjuk, csak a függőségőrző és 3NF 
tulajdonság garantálható. 


2. p konstrukciója során kiderülhet, hogy valamely Ft; részséma tartalmazza 
R valamely kulcsát. Ekkor felesleges egy ik 1-edik sémát külön definiálni 
egy kulcs számórn, hiszen n veszteségmentességet biztosító minden mccha- 
nizmus ekkor ís működik. 


Példa. Egyetemi kurzusok adatait szeretnénk tárolni, az R(Kurzus, Tanár, 
tdőpont, Helyszín, Diák, Jegy) z R(K, T, f, ff, D, J) sémában. A függöségek: 


- KT: minden kurzushoz csak egy tanár tartozhat. 

a [a fé egy időpontban egy helyszínen legfeljebb egy kurzus lehet. 
- ITG H: egy időpontban egy tanár csak egy helyszínen lehet. 

a KDG J. egy kurzusban egy diák csnk egy jegyet kaphat. 

- 1D5 I egy időpontban egy diák csak egy helyszínen lehet. 


APÍKT IHK ITH, KDJ, IDIf) sémafetbontás az 1. megjegyzés miatt $NF, füg- 
gőségörző felbontás, Ha azt szeretnénk, hogy a felbontás veszteségmentes ís legyen, 
akkór keressük meg R (egyik) kulcsát! Azt gondoljuk, hogy az 1D attribútumhal- 
maz kulcs. Határozzuk meg ezért a lezárását: 


ma JDÉD — ID, 

- IDD — fDH, 

- IDD z IDHK, 

- IS — IDHKJ, 
- IDÍD — IDHKJT, 


tehát IDt z IDHKJIT, az attribútumok teljes halmaza, így ID legalábbis szuper- 
kulcs. Ugyanakkor minimális is, mert F-ben sem I, sem D egyedül semmilyen más 
attribútumot nem határoz meg, It — I, Dt — D, vagyis az ID valóban kulcs. 
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Ha hozzávesszük a p felbontáshoz az ID séinát a 2. megjegyzés szerint, nkkor az 
eredmény p-val azonos lesz, hiszen p utolsó sémája tartalmozza az ID attribútu- 
mokat. Tehát valójában p veszteségtnentes ís volt, 


Tétel. Minden, legalább INF f sémának létezik veszteségmentes felbontása 
BCNF sémákba. 


Bizonyítás. Iteratívan készítjük cl a felbontást. Az iteráció minden fázisában 
igaz lesz, hogy a pillanatnyi felbontás veszteségmentes. 


1. Ha f az adott F függőségek mellett BCNEF, akkor nincs tennivaló, készen 
vagyunk. 

2. Ha R nem BCNF, akkor 3X — A € Ft, ami megsérti a BONF tulajdonsá- 
gokat, azaz A g X és X nem szuperkulcsa ft-nek. Legyen ekkor a felbontás 
pi( ft ft), Rj - XA, fa — RV A, melyről belátható, hogy 

- veszteségmentes felbontás és 

- Ri és ft2 is kevesebb attribútumot tartalmaz, mint f. fta nyilván ki- 
sebb f-nél, hiszen az A attribútumokat nem tartalmazza. ff) pedig 
azért kisebb, mert különben X — A neim sérthetné an BCNF tulajdon- 
ságot. 

. Vizsgáljuk meg, hogy Rai, ill. f2 BCNF-e. Ehhez még kell határoznunk 
a részsérmákra vetített függöségeket. Ha mindkettő BCNF, akkor készen 
vagyunk. 

. Ha R, Az között van, amelyik nem BCNF, akkor arra a séimárn ismételjük 
meg az eljárást a 2. ponttól. 


Mivel egy veszteségmentes felbontás veszteségmentes felbontása ís veszteségmen- 
les, így az iteráció tetszöleges mélységben folytatható. Másrészről, mivel a lege 
feljebb két attribútumot tartalmazó sémák mind BCNF-ek, Így előbb-utóbb a 
felbontás részei BCNF sémák lesznek. 





Példa. Legyen ndott a NYELV(IDIÁKKÓD, DIÁKNÉV, OFŐNÖK, OFTEL, 
NYELV, FÉLÉVKŐÓD, OSZTÁLYZAT, relációs 6éma és a funkcionális függőségek 
alábbi (nem minimális) halmaza: 


- DIÁKKÓD 5 DIÁKNÉV 

- DIÁKKÓD - OFŐNÖK 

- OFŐNÖK — OFTEL 

- OFTEL —- OFŐNÖK 

- DIÁKKÓD — OFTEL 

- DIÁKKÓD, NYELV, FÉLÉVKÓD 5 OSZTÁLYZAT 


Bontsuk fel BONF alakú sémákba veszteségmentes dekompozícióval! 
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A séma egyetlen kulcsa a DIÁKKÓD, NYELV, FÉLÉVKŐÓD attribútumhalmaz. 
Válasszuk ki az OFŐNÖK — OFTEL függőséget, és bontsuk fel a NYELV sémát 
két részre az előbbiek szerint: 


- RI(OFŐNÖK, OFTEL) 
- Ra(DIÁKKÓD, DIÁKNÉV, OFŐNÖK, NYELV, FÉLÉVKŐD, 
OSZTÁLYZAT) 


Az fh BCNF alakú, így csak az ft2-t vizsgáljuk tovább. 
Ennek függőségei: 

- DIÁKKÓD 5 DIÁKNÉV 

- DIÁKKÓD a OFŐNÖK 

- DIÁKKÓD, NYELV, FÉLÉVKÓD — OSZTÁLYZAT 
tehát Ra kulcsa továbbra is DIÁKKÓD, NYELV, FÉLÉVKŐD, 


Ra még mindig nem BCNF alakú, mert a DIÁKNÉV, OFŐNÖK nem-üres attri- 
bútamhalmaz determinánsa DIÁKKÓD, de nem szuperkulcs. 


Az első két függőséget az alábbi formában is felírhatjuk: 
- DIÁKKÓD a DIÁKNÉV, OFŐNÖK 
Konstruáljuk meg a következő felbontást ezen függőség alapján: 


- R.(DIÁKKÓD, DIÁKNÉV, OFŐNÖK) 
- fu(DIÁKKÓD, NYELV, FÉLÉVKÓD, OSZTÁLYZAT) 


Itt már fa és Ry is BCNF alakú, tehát készen vagyunk. A keresett felbontás az 
Rt. Rz és nz fg sémák együttese. 





Megjegyzések. 


1. Mivel a függőségőrzés megtartása mellett nem mindig érhető el a BONF fel- 
bontás (részletesebben Id. a megjegyzések után), ezért nem érdemes minden 
csetben BCNF alakokra törekedni egy relációs adatbázis tervezése során. 
(A másik az, hogy sok kis relációból általában költségesebb, tehát adott 
gépen lassúbb egy lekérdezés eredményének összeállítása. Esetleg éppen 
a lekérdezési válaszíidők csökkentése érdekében alkalmanként szándékosan 
redundanciát építenek bele a relációkba, ld. lekérdezés-intenzív/analitikus 
rendszerek.) 

2. Vegyük észre, hogy más függőségeket, (ill. más sorrendben) választva a fel- 
bontás alapjául az eredményül kapott sémák is más-más attribútumokat 
tartalmazhatnak. 

3. Egy másik, kézenfekvő lehetőség BCNF sémafelbontások előállítására, hogy 
a 3NF, függőségőrző és veszteségmentes sémák előállítására alkalmas, fen- 
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tebb leírt algoritmussal előállított felbontásból indulunk ki. Minden cész- 
sémárn megvizsgáljuk, hogy az BCNF-e. Ha egy séma nem BCNF, akkor 
tovább bontjuk veszteségmentes dekompozícióval pontosan az imént leírt 
módszerrel. A módszer előnye, hogy hamarabb eredményre vezethet, mivel 
garantáltan 3NF sémákból indul ki, 

4. A BCNF tulajdonság ellenőrzése igen költséges lehet. Szerencsére számos 
egyszerűsítésre nyílik lehetőség, melyek részleteire azonban nem térünk ki. 


Könnyű példát mutatni arra, amikor egy séma nem bontható fel veszteségmente- 
sen és függőségőrzően BCNF sémákba. 


Vegyük ismét a már ismert R(VÁROS, ÚT, IR SZÁM) — REV, U, 1) sémát, ame- 
lyen most is az F.- (VU— I.15 V) függőségeket értelmeztük. Így R kulcsai UT 
és VU, az [ 5 V függőség miatt R nem BCNF. Készítsük el a séma egy valódi, 
veszteségmentes felbontását! Könnyen ellenőrizhető, hogy P(Rt(UT), R2(V)) az 
egyetlen lehetőség. A részsémák nyilván BONF-ek. A vetített függőségek; mr) (íF) 
csak triviális függőségeket tartalmaz, Ra (FP) z [5 Vitriviális függőségek). 
Mivel a VU 5 / függöség a sémafelbontás során elveszett, ezért p nem függöség- 
őrző. 

Az előbbiek alapján a normalizálás elméletét egy másik módon is felépíthetjük: 
redundanciamentes relációkat akarunk létrehozni fűüggöségörző és veszteségmen- 
tes felbontással. A redundanciamentességébez az szükséges, hogy minden sémán 
függöség csak szuperkulcstól lehessen (BCNF). De ekkor függöségőrző és veszte- 
ségmentes felbontásokat nem feltétlenül tudunk készíteni. Ezért célszerű egy eny- 
hébb normálforma bevezetése is. Ez lesz a $NF, amely ,éppen annyi" redundan- 
ciát tartalmaz, hogy mellette függőségőrző és veszteségmentes felbontást tehessen 
garantálni. A 2NF jelentősége ebben a gondolatkörben marginális. 


9.2.8. Többértékű függőségek 


Induljunk ki az R(ITANTÁRGY, TANÁR, JEGYZET) símából. Az ehhez tartozó 
telációnak legyenek elemei mindazon tanárok, akik egy ndott tantárgyat egy adott 
jegyzet felhasználásával tanítanak. Például az alábbi r(?) reláció adódott. 


Az R sémán nem értelmeztünk funkcionális függőségeket. Ennek következtében R 
kulcsa kizárólag az attribútumainak teljes halmaza, tehát R BCNF alakú. Ennek 
ellenére úgy érezzük, hogy redundanciát tartalmaz. [a pl. Lovász helyett Juhász 
jön matematikát tanítani, akkor ezt több helyen is ki kell javítani az ndatbá- 
zisban (módosítási anomália). Próbáljuk meg ft-ot felbontnni és a redundanciát 
csökkenteni! 
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ríft) 
TANTÁRGY] TANÁR 
matematika 
matematika 
matematika 
matematika 


JEGYZET 
Vektoranalízis 
Num. analízis 
Vektoranalíizis 
Nurn, analizis 


I] Öveges ] Vektoranalízis 


Vektoranalízis 
























fizika 






kémin Szerves kémia 
ri 72 
TANTÁRGY 


- TANTÁRGY] JEGYZET 
matematika 





— matematika ]! Vektoranalízis 
matematika - 7 És: 
fizika matematika ! Num. analízis 

— fizika Vektoranalízis 
kémin 7 ERNE 

7 kémia Szerves kémja 
fizika 


Ez n felbontás már mentes nz említett anomáliától, rándásul a két relációból 
az eredeti veszteségmentesen helyreállítható, tehát , jobb"! Ugyanakkor bizonyos, 
hogy n felbontás ném n funkcionális függőségek figyelembe vételén alapult, mint 
cddig minden csetben. 


Az ak az úgynevezett föbbértékű függőségekben rejlik, nmely a funkcionális füg- 
gőségek általánosításának tekinthető. A funkcionális függőségek esetén egy att- 
ribútumíhalnz) értéke egy másik attribútumí(halmaz) értékét meghatározta. A 
többértékű függőségek csetén pedig egy attribútum(halmaz) értéke egy másik att- 
ribútumíhalmaz) értékeinek egy bolmazát határozza meg: jelen csetben egy tan- 
tárgyhoz egy tanár-halmoz (itt. egy jegyzet-halmaz is) tartozik. 


Ez azonban nem clég ahhoz, hogy többértékű függőségről beszélhessünk a tan- 
tárgyak és a tanárok között, ehhez egy további szabályszerűség is tartozik, amely 
során a sémában található többi attribútumot ís figyelembe kell venni: 


Ha (tantárgy, tanári, jegyzetf) valamint (tantárgy, tanár2, jegyzet?) is egy-egy ele- 
me a relációnak, akkor (tantárgy, tanári, jegyzet2) valamint (tantárgy, tanár2, 
jegyzett) is a relációhoz kell, hogy tartozzon. (Ha töröljük az r(f) reláció első 
4 sora közül bármelyiket, utána r, és re természetes illesztése többé nem adja 
vissza r-et!) 


Mindezt fogalmazzuk meg pontosabban: 





Definíció - többértékű függőség (multivalucd dependency, MVD). Adott egy R 
sérna és attribútumainak egy X és Y halmaza. Ha Vt1,t2 € r(R)-hez, amelyre 
ti(XI — tol X] (de más attribútumokon ez nem áll fenn!) 3-3, ta € rí), hogy 
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- es[x] [2] - hulA], 
— egly] z ily] és tslRVXYI- GlRVXYI, 
- ely) - tel] és ts (RVXYI] z alt xy], 


akkor Y többértékűen függ X-től (X multi-determinálja Y-t). Jelölése: XV, 








Megjegyzés. Vegyük észre, hogy a definíció szimmetriája mintt egyidejüleg 
fennáll X — RNXY ís. 


X -e Y tehát ,ekvívalens" X - RV XY-nal, és mindkettő azt jeleni, hogy 
AX minden egyes értéke meghatározza Y és RYAXY lehetséges értékeinek egy 
halmazát, és ezen értékek minden egyes kombinációja (tehát minden megengedett 
Y érték mindegyik megengedett RYXY értékkel) elő is kell, hogy forduljon ilyen 
X mellett. 





Tétel. Ha X 6 Y fennáll, akkor X — Y is ígaz. 


Bizonyítás. A többértékű függőség definíciójából következik, ilyenkor az X-hez 
tartozó Y halmaznak csak egyetlen eleme van. 





A többértékű függőségeknek szintén léteznek axiómái, melyek az Armstrong axi- 
ómákhoz hasonlóak, Számos tétel is általánosítható a többértékű függőségekre. 
Részletes ismertetésük túlmutat a tárgy keretein, az alábbiak elsősorban illuszt- 
rációnnk tekintendők. 


Tétel. Legyen R egy séma, píitz, ft2) egy felbontása, D pedig sz ft sémán ér- 
telmezett funkcionális és többértékű függőségek halmoza. p akkor és csak nkkor 


veszteségmentes, ha (Rip Nn R2) — (RA R2) (vagy (Rn ft2) — (RA R)) 
következik a D függöségekből. 





Speciálisan, ha R(A, B,C) és P(( AB, AC) alakú, akkor p veszteségmentességének 
szükséges és elégséges feltétele, hogy A -r B (vagy A -- C) fennálljon. Ennek elég- 
séges feltétele, hogy A — B vagy A — € igaz legyen, összhangban a 9.2.4.5. alnl- 
szakasz tételével. (A tétel azért is hasznos, mert egyúttal módszert is ad többér- 
tékű függőségek tesztelésére.) 


Létezik egy általánosítása a BCNF-nek többértékű függőségek esetére, nmit ne- 
gyedik normálformának (4 NF) neveznek. 
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Definíció - 4 NF. Égy relációs séma 4NF alakú, ha X — Y esetén X szuüper- 
kulcs, miközben 


1. Y nem részhalmaza X-nek és 
2. XY-on kívül a sémának van más attribútuma is. 











Megjegyzések. 


1. A kulcs, ill, szuperkulcs definíciójában továbbra is csak funkcionális függé- 
seket értelmezünk. 

2, Ha egy sémán csak funkcionális függőségeket értelmezünk, akkor 4NF — 
BCNF. 

3. Minden relációs séma, amelyen funkcionális és többértékű függőségeket is 
értelmezünk, felbontható veszteségmentes dekompozícióval 4NF alakú sé- 
mákba. 





9.3. A fejezet új fogalmai 


adatbázis kényszerek (értéklüggő, értékfüggetlen), tartalmazási függés, funkcio- 
nális függés (eseti, érdemi), implikáció, relációs séma determinánsa, (minimális) 
kulcs, szüperkulcs, idegen kulcs, egyszerűfösszetett kulcs, elsődleges kulcs, kulcs- 
jelölt, elsődlegesmásodlagos attribútum, teljes/részleges függés, tranzitív függés, 
reláció redundanciája, atomi attribútum, INF, 2NP, 3NF, BCNE, funkcionális 
függés igazságnzlevezethetősége adott függéshalmaz mellett, az Armstrong axi- 
ómák, az axiómák igazsága és teljessége, függéshalmoz lezártia, attribútumhal- 
maz lezártja, sémnfelbontás, veszteségmentes sémafelbontás, vetített függéshal- 
maz, függöségőrző sémafelbontás, többértékű függőség, 4ANF 
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10. fejezet 


Tranzakciók adatbázis-kezelő 
rendszerekben 


Mindeddig arról volt szó - hallgatólagosan -, hogy valamely adatbázis-kezelő rend- 
szer egyidőben egyetlen felhasználó egyetlen programját szolgálja ki, egyéb igények 
csak a korábbink kiclégítése után következhetnek. A 9. fejezetben megmutottuk 
azt, hogy milyen módszerekkel lehet és célszerű n relációs ndatbázis-kezelő logikni 
adatstruktúráit annak figyelembevételével kialakítani, hogy az adatbázis-kezelő 
tranzakciófeldolgozó képessége (praktikusan az adntbázis tartalmának módosítá- 
si képessége) minél mognsabb lehessen. A továbbiakban annnk a problémakörét 
vizsgáljuk meg, hogy milyen nehézségek merülnek fel nkkor, ha több felhasználó 
vagy program ,egyidejüleg" (Id, concurrency) kerül kiszolgálásra nhn DBMS által. 


10.1. Bevezető 








Definíció - tranzakció (transactton). (Tágabb éríelemben is): Egy program egy- 
szeri futása, amelynek vagy minden művelete hatásos, vagy belőle semmi 6cin 
(Id. atomícitás, oszthatoatlanság). 





Ahhoz, hogy egy tranzakció egy DBMS konkurens környezetében is értelmezhető 
legyen, hagyományosan további tulajdonságokat is, ill. ezek közül minél többnek 
a teljesülését civárják töle. Ezeket az angol elnevezések kezdőbetűiből alkotott 
betűszó után ACID tulajdonságoknak nevezik. 


— atomicitás (atomicity): Id. fentebb. 

— konzisztencia (consistency): csak sikeresen (teljes egészében) lefutott tranz- 
akcióknak van hatása az adatbázis tartalmára, ekkor a tranzakciók az adat- 
bázist egyik konzisztens állapotból egy másikba viszik átl. 

1 


A fogalom több más módon is értelmezhető, de fontos, hogy jelen jegyzet kontextusában czt 
a definíciót fogadjuk el. 
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— izoláció (isolation), másnéven elszígetelés: minden tranzakció úgy fut le tegy 
konkurens környezetben is), mintha közben más tranzakció nem futna. 

— tartósság (durabilíty): ha egy tranzakció már sikercsen lefutott, akkor annak 
hatása snem veszhet elt? 


Az ndatbázis-kezelőkben a tranzakciókezelés megvalósítása alapvetően arról szól, 
hogy milyen feltételek mellett, milyen módszerekkel, milyen hatékonyan lehet az 
ACID tulajdonságokat biztosítani? 

A tranznkciók mnguk is elemi lépésekből állnak; írás/olvasás -H kiegészítő lépések: 
ezek szintén oszthatatlannak tekintettek. 





Definíció - ütemezés (schedute). tranzakciók elemi műveleteinek összessége, 
melyben a műveletek időbeli sorrendje is egyértelműen meghatározott. 


Problémák a iranzakciókkal: 


— idő előtti befejeződés (Id. 10.7. szakasz) 
o nullával osztás/illegális művelet végzése 
o nem fér hozzá adathoz 
6 kívülről lövik ki 
- konkurens rendszerekben a tranzakciók műveletei összefésülődhetnek, mert 
a tranzakció általában nem tud befejeződni, mielőtt az adatbázis-kezelőnek 
el kell kezdenie egy másik tranzakciót kiszolgálni, vagy folytatnia egy másik 
tranzakció kiszolgálását. 


A tranzakciók egymásba fésülődése csak akkor probléma, ha közös erőforráshoz 
akarnak hozzáférni. A közös erőforrások jelen vízsgálatainkban csupán nz adatok 
lesznek. 


10.2. Ütemezések (schedules) 


Ha a tranzakciók egy rendszerben szigorúan egymás után futnak le úgy, hogy 
egyidejűleg mindig csak egyetlen tranzakció fut, tehát időben nem lapolódnak át, 
akkor cz egy soros ütemezés (serial schedule). Egy soros ütemezés mindig megvaló- 
sítható, problémamentes, amennyiben a tranzakciók külön-külön megvalósíthatók, 
és az izolációjuk természetes módon teljesül. 


Minden egyéb ütemezés neve; nem soros ütemezés (non-serial schedule). Ilyen üte- 
mezés megvalósulhat egyetlen CPU-n (időosztással) vagy több CPU-n is. A nem 


7? Néha igen szélsőséges feltétetek mellett kelt ezt biztosítani, ami jelentős költségekkel járhat. 

3 Az ún. NOSOL adatbázis-kezelőkben (id. C. föggelék) egészen más elvárások is megfogalma- 
zódhatnak a konkurencia biztosítása kapcsán, ezért az ACID tulajdonságok elsődlegesen a 
aklasszíkus" rendszerekre igazak. 

§ Vegyük észre, bogy a soros ütemezés egy elégséges, de nem feltétlenűl szükséges feltétel a 
tranzakciók izolációjához. A cél éppen az, hogy a tranzakciók minél nagyobb fokú konkurert- 
ciája valósulhasson meg, és ezzel együtt a gépi erőforrások jobb kihasználhatósága. 
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soros ütemezések lehetnek sorosíthatóak (serinlizable schedule) vngy nem sorosít- 
hatóak (non-serializable). 





Definíció - sorosíthatóság (seriafizabítity). Egy ütemezés pontosan nkkor 50- 
rosítható, ha létezik olyan soros ütemezés (cz lesz a soros ekvivalens ütemezés, 
serial eguivalent schedule), amelynek minden hatása n módosított adatokra azo- 


nos az adott ütemezésével. 


Nem soros ütemezés esetén a tranzakciók egymásba fésülődésezátlapolódása a 

következő problémákat okozhatja: 

Piszkos olvasás (dírty read): egy 7? tranzakció olyan - ún. piszkos (Id. Tran:- 
akcióhibdák kezelése, 10.7. szakasz) - adatot olvas, melyet egy másik, Ti tranz- 
akció azelőtt írt az adatbázisba, hogy sikeresen befejeződött volnn. Ha a Ty 
tranzakció végül valóban sikertelennek bizonyul, akkor n piszkos adat az 
adatbázisból mihamarabb eltávolítandó. 





Példa. 

READ A 

AzAt1 

WRITE A 
READ A 
AzAcI 
WRITE A 
COMMIT 

ABORT 


Elveszett módosítás (lost update): több tranzakció ugyannzon az adntegysé- 
gen végez módosításokat úgy, hogy egy 7i tranzakció felülírja a másik, T? 
által végzett műveletek eredményét, 


Példa. 





WRITE A 


WRITE A 


Nem megismételhető olvasás (non-repeatable read): egy Tt tranzakció 
különböző eredményeket kap egy adategység többszöri olvasásakor, mert 
egy másik, Ta tranzakció időközben módosította azt. 
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Példa. 





READ A 
READ B 
B-4A4B 
WRITE B 


READ A 
Az4At1l 
WRITE A 

READ A 

READ C 

C5sA$r0 

WRITE C 


Megjegyzés, Vegyük észre, hogy a nem megismételhető olvasás annyiban 
tér el az elveszett módosítástól, hogy itt az egyik tranzakció (a példákban 


T2) által elvégzett módosítás nem veszik el. 





Fantom olvasás (phantom read): egy Ty tranzakció többször is végrehajtja 
ugyanazt a lekérdezést, miközben egy másik, T; tranznkció olyan rekordokat 
szúr be vagy töröl, melyek kielégítik a 74 lekérdezésének szelekciós feltételét. 
Így a korábbi lekérdezés más rekordhalmazt adhat vissza, mint az utána 
következőík). 


Példa. 





INSERTY TO r 


Megjegyzés. r az adatok egy (bizonyos szelekciós feltételnek megfelelő) 
halmazn, Y pedig egy (a szelekciós feltételt (részben) színtén kielégítő) 
rekordhalmaz. 





Fentiek elkerülése, ill. a kapcsolódó problémák megoldása a tranzakciókezelés 
egyik központi kérdése. Egyik lehetőség, ha egyenként keresünk megoldásokat. 
Észrevehetjűk azonban, hogy a soros ütemezéseknél a fenti problérnák fel sem 
merülnek. Ezért; 


Definíció - izolációs elv fisolation principle). Feltételezzük, hogy egy tranzakció 


elvárt, korrekt eredménye az, amit akkor kapunk, ha a tranzakció futása közben 
más tranzakció nem fut. 
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ln tehát nem lehet egy nem soros ütemezésnél biztosítani, hogy ugyannzt az 
eredményt produkálja, mintha a tranzakcióit valamely sorrendben sorosan egymás 
után futtatnánk le, akkor az ütemezést nem tekintjük helyesnek, korrektnek. 





Definíció - korrekt fcorrect). Egy ütemezés pontosan okkor korrekt, ho sorosít- 
haló. 


Példa. Soros, sorosítható és nem sorosítható ütemezések: 





READ 8 
AzA 10 READ 8 
B-B 2 WRITE A 
WRITE A HzR3 2 
WRITE 8 WRITE 8 READ B 
READ B READ B WRITE 8 
BzB 20 READ C Bs B-410 
WRITE 8 87 B410 READ C 
READ C €-€-H420 WRITE 8 
€-Ct420 WRITE B C€5sC-r20 
WRITEC WRITEC WNTEC 
a) soros ütemezés 4) sorosítható c) nem sorosítható 
ütemezés ütemezés 


A sorosíthatóság számos módszerrel és feltétel mellett biztosítható. Általában az 
adathozzáférés módjának alkalmns korlátozása jelenti n probléma megoldását, 


Az adathozzáférés 
- módjának szabályozása pl. zárakkal (lock) (Id. 10.3. szakasz), és/vagy idő- 
bélyegekkel (Id. 10.9. szakasz) történhet, 


- egységeinek megválasztása (granularitás, granularity) kritikus rendszertech- 
nikai kérdés. 





Megjegyzések. 


1. A definíció alapján nehéz eldönteni, hogy egy ütemezés sorosítható-e, hic 
szen elvíleg minden tranzakció minden adategységét meg kell vizsgálni, 
márpedig A számú tranzakció esetén A! számú soros ütemezés képzelhető 
el. 

2. Kisebb hibát vétünk akkor, ha egy sorosítható ütemezést nem sorosítható- 
nak minősítünk, mint fordítva. 

3. A sorosíthatóság kérdését a gyakorlatban folyamatosan (,on-the-íly") kell 
tudni megítélni, minden egyes új adáthozzáférési igény kapcsán (Id. üte- 
mező). 
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4. Tipikus gyakorlati megoldás: olyan szabályok (protokottok) megalkotása, 
amelyeknek a betartása garantálja a sorosíthatóságot. 





Gere] 


1ártáblázat zárkérések 
zárelhelyezés v. zárelutasítás 


DG : engedélyezett 
kérések műveletek 
— 


várakortatás vagy ] 


abort 


10.1. ábrn. A konkurens működés elemei zár alapú tranzakciókezelés esetén 





Definíció - ütemező (scheduler). A DBMS$ azon része, amely az adatelérési 
igények megítélése felett dönt (pl. n sorosíthatóság biztosítása és a pattok (Id. 
alább) feloldása érdekében). Ennek során 


- engedélyezheti nz egyes műveleteket, vagy 
- hn ennek feltételei nem állnak fenn, akkor 


o várakoztathatjn, ill. 
o nbortálhatja, újraindíthatja a tranzakciókat, 


NM S ám E ááá a ém ma — ám km ege 


Az ütemező bonyolultsága jelentősen függ az alkalmazott protokolitól. Zárkezelé- 
sen alapuló tranzakció menedzsment csetén szorosan együttműködik a zármene- 
dzserrel. A zármenedzser kezeli a zártáblázatot, mely az alábbi szerkezetű bejegy- 


zéseket tartalmazza: 


(adategység yzártípus) (tranzakció) 


10.3. Tranzakciókezelés zárakkal 


Definíció - zár (fock). Hozzáférési privilégium egy adategységen, amely adható 


és visszavonható. 





Példa. Hogyan kezelik a zárak a konkurenciát? 


Tekintsük az előbbiekben ismertetett példát az elveszett módosítás problémára! 
Bár 7) és T; egyaránt 1-gyel növelték A értékét, az végeredményben csak I-gyel 
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nőtt. Ennek oka, hogy T) anélkül módosította A-t, hogy tudott volna a T3 által 
végzett módosításról. Ha T; módosításait meg akarjuk akadályozni, akkor helyez- 
zünk cl zárakat (legkésőbb) az adatmódosító műveletek előtt (és célszerű, hn a 
felszabadításaikról is gondoskodunk (legkésőbb) a tranzakció végén): 





LOCK A 
READ A 
Az A31 
AzA4t1 
WRITE A 
UNLOCK A 
WRITE A 
UNLOCK A 


10.1. táblázat 


A (LOCK A..UNLOCK A) műveletek között más tranzakció csak korlátozottan 
(vagy sehogyan sem) fér hozzá az A adategységhez, Ezért a zárak szinkronizációs 
primitívként is szolgálnak: ha egy tranzakció lockolni akar egy adategységet, amin 
egy másik tranzakció tart fenn zárat, akkor addig nem mehet tovább, amíg a zár 
- bármely okból) kifolyólag - fci nem szabadul, 


Ennek hatására a T? tranzakció a harmadik sorban valójában nem fogja tudni 
végrehajtani n zár elhelyezését az A ndategységen, hanem meg kell várnin annak 
felszabadítását. A vezérlés a másik tranzakcióra adódik át, ezért a fenti Ty és T2 
tranzakciókból álló ütemezés valójában így fog lefutni: 





LOCK A 

READ 4 

Az4A51 T2 várakozik 

WRITE A 

UNLOCK A 
LOCK A 
READ A 
Az4A4t1 
WRITE A 
UNLOCK A 


10.2. táblázat 


Ekkor már helyesen, 2-vel fog nőni A értéke T) és T2 lefutása után? 


5 A példában egy soros ütemezés valósult meg a zárak alkalmazása miatt, de hangsúlyozzuk, 
hogy ez messze ném tőrvényszetű. 
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Definfció — legális ütemezés ffegal schedule). Legális az az ütemezés, amelyben 


— a lockolt adategységeket fct is szabadítják (unlockkal), továbbá 
- ha egy adategység már foglalt — mert egy másik tranzakció tart fenn zárat 
rajta (ami nem megosztható) -, akkor a tranzakció a zár felszabadulásáig 
várakozik. 













A fenti 10.1 táblázatban látható ütemezés tehát nem legális, a 10.2 táblázatban 
látható viszont legális. 


10.4. Problémák a zárakkal 


Ha egy Tm Iranznkció azért nem tud továbblépni, mert egy olyan A adategység 
felszabadítására vár, amin egy olyan T, Z Tm tranzakció tart fenn zárat, ami 
víszont azért nem tud továbblépni és a zárat felszabadítani, mert ehhez olyan 
adategységhez kellene hozzáférnie, amin már Tia tart fenn zárat, akkor patiról, 
hotipontról (deadlock) beszélünk. 


Patt elképzelhető természetesen kettőnél több tranzakció részvételével is. 
Megoldási lehetőségek: 


1. A tranzakciók lockoljanak mindent egyszerre, amire a futásukhoz szükségük 
lehet, an valamely zárat nem kaphatják meg, akkor ne is próbálkozzanak 
egyetlen művelet elvégzésével sem. 

2. Ha egy tranzakció ,túl sokáig" várakozik, akkor valószínűsíthető, hogy patt- 
helyzetbe került, ezért abortálnndó. 

3. Valamilyen egyértelmű sorrendet rendeljünk nz adategységekhez és zárat 
csak ennek a — pl. növekvő - sorrendjében lehessen kérni. 

4. Folyamatosan mónítorozzuk a zárak elhelyezését, és ha pattot érzékelünk, 
akkor valamely tranzakciót, amely a pattot okozza, kilőjük. 


Ez utóbbihoz szükségünk van egy eljárásra, umivel érzékeljük a patthelyzetet. Egy 
lehetőség: tárakozási gráf rajzolása. 


Definíció - várakozási gráf (wait-for graph). Olyan irányított gráf, ahol a gráf 
csomópontjai a tranzakciók, egy élt pedig akkor rajzolunk a T; csomópontból a T; 
csomópont felé, ha a T; tranzakció bármely okból várakoztatja a 7; tranzakciót 
úgy, hogy az nem tud továbbmenni." 


.  Kilejezőbb lenne a várakoztatási gráf elnevezés. 





Tétel. Adott időpillanatban nincs patt 6 a várakozási gráfban nincs kör (azaz 
a gráf irányított körmentes gráf (DAG)) 
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Bizonyítás. Előre: (indirekt) t. f. h. van kör. Az élek rajzolásának szabálya mintt 
ez azt jelenti, hogy a körben résztvevő tranzakciók egymást várakoztatják, egyik 
sem tud továbblépni, ami éppen egy patthelyzetet jelent, ellentmondásban nzzal, 
hogy nincs patt. Tebát ha nincs patt, akkor nem lehet kör a várakozási gráfban. 


Visszafelé: ha a gráf DAG, akkor létezik topologikus rendezése, ekkor pedig ez a 
tranzakcióknak egy olyan sorbarendezése, amelyben a tranzakciók sorban egyinás 
után elindulhatnak anélkül, hogy várakoztatnák egymást. Tehát nincs patt. 





Nem a patt az egyetlen lehetőség arra, hogy egy akár legális ütemezésben szereplő 
tranzakció ne tudjon lefutni. Ha egy tranzakció egy ndategység lockolására vár, 
de közben más tranzakciók mindig lockolják előtte a kérdéses adategységet, akkor 
éhezésrőt (starving, livelock) beszélünk, Egy lehetőség az ébezés elkerülésére, ha 
feljegyezzük a sikertelen zárkéréseket, és ha egy adategység felszabadul, akkor 
zárat csak a zárkérések sorrendjében ítélünk oda (ami először megy be, az jön ki 
először (FIFO) stratégia). 


10.5. Tranzakció modellek 


A szabályos tranzakciókat jellemző tulajdonságok gyüjteménye. 









Definíció - egyszerű tranzakció modell (simple iransaction model). Egyszerű 
tranzakció modellről beszélünk, ha 


- csak egyfajta zár létezik 
— egy adntelemen egyidőben csak egyetlen zár lehet. 


Adott adatelemen zár elhelyezésének következménye, hogy a LOCK .. UNLOCK 
műveletek között más tranzakció az adott adathoz semmilyen módon nem férhet 
hozzá, Ugyanakkor feltételezzük, hogy a zárat elhelyező tranzakció az adatelemcet 
Írta ís és olvasta ís. 


Egy adott ülemezés sorosíthatósága eldönthető a sorosítási gráf segítségével. 







Definíció - sorosítási gráf, precedenciagrál (preccdence graph), Olyan irányított 
gráf, amelynek a csomópontjai a tranzakciók, egy élt pedig akkor rajzolunk a T; 
csomópontból a 7; csomópont felé, ha van olyan A adategység, amelyen egy adott 
5 ütemezésben a 7; tranzakció zárat helyezett el, majd a zár felszabadítása után 
először a T; tranzakció helyez el zárat A-n. 


A definíció háttere az, hogy, amikor élt rajzolunk a T; csomópontból a T; csomó- 
pont felé, akkor a T; tranzakció az A adategységnek olyan értékét olvassa, amit 
T; hozott létre. Tehát T; meg kell, hogy előzze T;-t az ütemezés minden soros 
ekvivalensében, ezt fejezi ki a nyíl. 
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Ti 






LOCK A 


UNLOCK A 
; Itt más tranzakció nem nyúl A-hoz 


1 
5—0 


10.2. ábra, Precedenciagráf rajzolása egyszerű tranzakció modellben 


LOCK A 


Tétel. Egy 5 ütemezés sorosítható 6 a sorósítási gráf DAG. 


Bizonyítás. Előre (indirekt): t, f. h. S sorosítható, de tartalmaz kört a soros[- 
tási grófja. Ekkor a kört alkotó tranzakciók közül egyik sem clőzi meg a másikat, 
tehát egy soros ékvivalensben egyik sincs legelöl, azaz az ütemezés ném sorosít- 
ható, ellentmondásban a feltétellel. 


Bizonyítás. Visszafelé: ha a gráf DAG, akkor létezik topologikus rendezése. 
Belátjuk, hogy ebből a rendezésből legalább egy soros ekvivalens előállítható. 
Ugyanis a legelől álló tranznkció (vagy tranzakciók) nem olvasbatínak) olyan 
adategységet, amin egy másik tranzakció korábban már zárat helyezett cl, tehát 
először lefuthatínak), Ha a gráfból eltávolítunk egy ilyen tulnjdonságú tranzak- 
ciót (Ta) Jelölő csomópontot, nkkor a marndék gráf továbbra is DAG, tehát 
továbbra ís létezik topologikus rendezése, A korábbi megfontolás Lovábbra is ér- 
vényes, így megadhntóík) az(ok) a tranznkciófk), amelyek TasG után lefuthatnak, 
mert vagy egyáltalán nem olmsínak) olyan ndntegységet, tmin egy másik tronz- 
nkció korábban már zárat helyezett el, vagy csak Tass által már korábban lockolt 
adategységen helyeznek el zárat. Mindez addíg folytatható, amíg a gráf minden 
csomópontját eltávolítottuk a gráfbólk: az eltávolítás sorrendje nz előbbiek alapján 
az ütemezésnek egy soros ekvíivalense lesz. 





Példn. Adott az alábbi ütemezés; 
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Ti T 


LOCK A 









LOCK 8 
: UNLOCK A 
LOCK C 
UNLOCK B 





LOCK A 
LOCK B 
UNLOCK A 





LOCK A 
UNLOCK A 






UNLOCK CC 






UNLOCK B 






LOCK C 
UNLOCK C 


Sorosítási grálja: 


ze (0 agy 


, 


Gy 


Soros ekvivalens ütemezések lehetnek; 


0 


va 


TTsTOTaT3 vagy 
TT ToT4T3 vagy 
TITSTAToT3 vagy 
TsnyTaToTz vagy 
TTTTOT3 vagy 
TIaTsToT3 vagy 
T.TaT1T2T3 vagy 
TaTsgT9T3 


Tehát az ütcinezés nyilvánvalóan sorosítható, 


A sorosítási gráf segítségével tehát a sorosíthatóság eldőntése visszavezethető kör 
kercsésére egy irányított gráfban. A kör keresés művelete minden zárkérés előtt 
elvégzendő, Így az egyidejűleg futó tranzakciók és az általuk közösen hnsznált 
adatelemek számának függvényében az ütemező működése jelentősen lassulhat. 
A gyakorlatban ezért elterjedtebbek azok a megoldások, amikor egy ütemezésben 
található minden tranzakció egy adott protokollt követ, amely protokoll mellett a 
sorosíthatóság vagy automatikusan teljesül, vagy egyszerű módszerekkel biztosít- 
ható, 
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10.5.1. Kétfázisú zárolás (2PL) 







Definíció - kétfázisú zárolás (twvo-phase locking, 2PL). Egy tranzakció a kétfá- 
zisú zárolás protokollt követi", ha az első zárfelszabadítást megelőzi mindegyik 
zárkérés. 


.  főviden azt mondjuk, hogy a tranzakció kétfázisú. 


"Fehát a tranzakció az első fázisban zárakat kér, a második fázisban pedig felsza- 
badítja azokat, 


Példa, Az előző példában T4 kivételével minden tranzakció kétfázisú. 


Tétel, Ha egy legális ütemezés minden tranzakciója a 2PL protokollt követi, 
akkor az ütemezés sorosítható. 


Bizonyítás. Mivel a sorosíthatóságnak szükséges és elégséges feltétele, hogy a 
sorósítási gráfban ne legyen kör, elegendő ezt belátni. 


Ehhez (indirekt) t, f. h, a csak kétfázisú tranzakciókból álló ütemezés sorosítási 
gráfjában mégis van kör. 


Tekintsük az (egyik) kört, melyet az alábbi tranzakciók alkotnak: 
Tett eTza GT on 
- A Ty a Té) megléte azt jelenti, hogy az ütemezésben vnn egy 
Ty : LOCK Aj . .. UNLOCK Az, . . . Tia : LOCK A; 


szekvencin. 
- ilasonlóan, n T;, — Tiz él megléte azt jelenti, hogy az ütemezésben van 
égy 
Ti, : LOCK Aja . . . UNLOCK Aj, ; e.g : LOCK Aja 
szekvencia. 
— Végül a 15. 2 Ti él megléte azt jelenti, hogy az ütemezésben van egy 


Ti, : LOCK Aj... UNLOCK Aj ... Tip : LOCK Ag, 


szekvencia. 


Láthatóan így a T;, tranzakció megsérti a kétfázisúság szabályát, hiszen 
UNLOCK után LOCK következik. Tehát az ellentmondásból arra jutottunk, 
hogy nem lehet kör a gráfban, az ütemezés sorosítható. 
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A későbbiek érdekében érdemes n bizonyításnak egy másik módját ís megvizsgálni. 
Ehhez definiáljuk a zárpont fogalmát. 





Definíció - zárpont (syncironization point), Az az időpont, amikor egy kétfá- 
zisú protokoll szerinti tranzakció az utolsó zárját is megkapjn. 


Tétel. A fenti tétel a zárpont segítségével is bizonyítható. 


Bizonyítás. A tétel bizonyításához rendezzük a tranzakciókat a növekvő zár- 
pontjuk szerinti sorrendbe. Beláthatjuk, hogy ez egy soros ekvivalens ütemezés 
lesz. 


T. f. h. az ütemezésben a Ti: LOCK A után következik a T;: LOCK A művelet 
(azaz minden soros ekvivalensben T; meg kell, hogy előzze T;-t). Ehhez nyilván 
az kell, hogy 7; felszabadítsa a zárat A-n (7: UNLOCK A), mielőtt T;: LOCK 
A következne. Viszont T; is kétfázisú, így meg kell hogy kapja minden zárját 
Ty: LOCK A előtt. Emiatt 7; biztosan megelőzi Tj-t a zárpontok növekvő sör- 
rendjében, valamennyi soros ekvivalensnek megfelelően. Így a növekvő zárpontok 
szerinti sorrend nem mond ellent a soros ekvivalensíekejt meghatározó feltéte. 
leknek, azaz egyike n lehetséges soros ekvivalenseknek, az ütemezés sorosíthntó. 





Megjegyzések. 


L. Ha valamely ütemezés tartalmaz egyetlen nem kétfázisú tranzakciót (71) 
is, akkor létezik olyan tranzakció (72), nmellyel együtt az ütemezés már 
nem sorosítható. 





Példa. 
LOCK A 
UNLOCK A 
LOCK A, B 
UNLOCK A, B 
LOCK B 
UNLOCK B 


Ennek a (legális) ütemezésnek a sorosítási gráfja: 
TezT 


Mivel kört tartalmaz, az ütemezés nem sorosítható. 


2. A 2PL protokollt követő tranzakciók esetén a kapcsolódó ütemező olyan 
egyszerű lehet, hogy emiatt a gyakorlatban igen gyakran alkalmazzák a 
2PL protokollt. 
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Definíció - RLOCK-WLOCK modell (shared and ezcítsive lock model), Az 
RLOCK-WLOCK modellben 


a kétfajta zár létezik: 


o RLOCK (megosztható, sharcable; puha, soft): ha T: RLOCK A érvé. 
nyes, akkor más tranzakció is olvashatja A-t, de senki nem írhatja. 


o WLOCK (nem megosztható, unsharcable; kemény, hard): ha T: 
WLOCK A érvényes, akkor T-n kívül semmilyen más tranzakció nem 
fér hozzá A-hoz, sem írásra, sem olvasásra, 


- Az UNLOCK művelet kiadása mind az RLOCK-ot, mind a WLOCK-ot 
felszabadítja, ami legális ütemezések esetén a tranzakció vége előtt bekö- 
vetkezik. 





A kétféle zár bevezetésétől azt várjuk, hogy kevesebb legyen a várakozás és a 
tranzakció abort, hiszen több tranzakció is képcssé válik egyidőben ugyanazon 
adntegységet olvasni. 


Hasonlóan az egyszerű tranzakció modellhez, itt ís lehetőség van a sorosítási gráf 
segítségével eldőnteni égy ütemezés sorosíthatóságát. 


A 10.3. ábra mutntja azt n három szekvenciát, amelyek esetén n prccedenciagráf- 
ban T; — T; él rajzolnndó: 


- Az első esetben T; feltétlenül T; után kell, hogy következzen, mert T;-nek 
T;-A61 független A értéket kell olvasnia, és ez igaz az összes olyan T;-re, amit 
T; előtt nem követett az A értékét író tranzakció. 

- A második esetben T;-nek azért kell T; után következnie, mert a szekvencia 
végén T;-től függő A értéknek kell marodnin A-ban. 

- A harmadik esetben T;-nek olyan A értéket kell olvasnia, amit 7; állított 
elő, így T;-nek T; után kell következnie, és ez — az első csethez hasonlóan 
— igaz az összes olyan T;-re, amit T; óta nem clőzött meg az A értékét író " 
tranzakció. 


Vegyük észre: valójában a hatékonyságnövekedést az okozza, hogy a 10.4. ábrán 
bemutatott READ... READ szekvenciák esetén nem kell élet húzni T; és T; kö- 
zött (ha az egyszerű tranzakció modellben göndolkódunk, akkor itt ís lenne él, 
tehát nagyobb lenne a kör keletkezésének valószínűsége; természetesen az üteme- 
zés másik szekvenciája miatt keletkezhet él 7; és 7; között). Az A-t csak olvasó 
tranzakciók sorrendje a sorosíthatóság szempontjából tehát mellékes, ha mind- 
egyik a legutóbbi, A-t író tranzakció után és az első, őt követő, A-t író tranzakció 
előtt következik a soros ekvívalensben. 


Tétel. Egy RLOCK-WYLOCK modellbeli § ütemezés sorosítható 5 a fenti sza- 
bályok szerint rajzolt sorosítási gráf DAG. 


Bizonyítás. Analóg az egyszerű tranzakció modell hasonló tételével. 
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1; 







RLOCK A 


UNLOCK A 
ő hu más tranzakció nem Írjn A-t 


9— o 


WLOCK A 


T 





T; 







WLOCK A 


UNLOCK A 
: pu más tranzakció nem nyúl A-hoz 


9—0 


WLOCK A 


T; 





T 





WLOCK A 


UNLOCK A 
E Itt más tranzakció nem Írja A-t 
RLOCK A í 


9—h 


10.3. ábra. Precodenciagráf rajzolása az R/W tranzakciómodellben 





I T; 


RLOGK A 


UNLOCK A 
: Itt más tranzakció nem nyúl A-hoz 


o" 6) 
10.4. ábra. Precedenciagráf READ... READ szekvencia esetén az R/W tranz- 


akciómodellben - természetesen az ütemezés másik szekvenciája miatt 
keletkezhet él T; és T; között 


RLOCK A 
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Definíció. Egy RLOCK-WLOCK modell szerinti tranzakció kétfázisú, ha min- 
den RLOCK és WLOCK megelőzi az első UNLOCK-ot. 


Tétel. Ha egy ütemezésben csak kétfázisú, RLOCK-WYLOCK modell szerinti 
tranzakciók vannak, akkor az ütemezés sorosítható. 


Bizonyítás, Analóg az egyszerű tranzakció modell hasonló tételével. 





Az RLOCK-WLOCK bevezetésével elérhető előnyök gondolata alapján további 
zármódok ís definiálhatók. Ettől nyilván akkor várhatunk további hatékonyság- 
növekedést, ha az értelmezett zármódok között minél több olyan van, amely egy 
adategységen egyidejűleg tartható fenn, azaz összeférhetők, kompatibilisek. A zár- 
módok közötti összeférhetőséget a zárkompatibilitasi mátrixban (fock compatibi. 
líty matriz) szokás ábrázolni. Égy mátrix elem ,igen", ha egy, az adatelemen lévő 
adott típusú zár mellett az új zárkérés ís elfogadhntó, és ,nem" akkor, ha az új 
zárkérés nem teljesíthető. 


Példa (1). Az RLOCK-WLOCK modell kompatibilitási mátrixa: 


meglévő zár az adategységen 

RLOCK WLOCK 
agái RLOCK igen nem 
SÖRÉTES WLOCK! nem nem 
Példa (2). Vezessük be az inkrementáőlis zár fogalmát! INCR A akkor helyezendő 
el A-n, ha úgy növeljük eggyel A értékét, hogy közben nem olvassuk ki azt. Két 
ílyen zárkérés felcserélhető, tehát kompatibilis egymással. Komnatibilítási mátri- 
Xn: 


RLOCK WLOCK INCR 
RLOCK igen nem nem 
WLOCK nem nem nem 
INCR nem nem igen 


Ha ismerjük az alkalmazott zárak kompatibilitási mátrixát, akkor fe! tudjuk raj- 
zolni valamely ütemezés sorosítási gráfját. 


10.6. Zárak hierarchikus adategységeken 


Mindeddig az említett zárkezelési mechanizmusok tökéletesen függetlenek voltak 
attól, hogy az adategységek milyen struktúrába szervezettek, ill. szervezettek-e 
egyáltalán. Látni fogjuk, hogy ennek a járulékos információnak a felhasználása a 
zárkezelés hatékonyságát tovább nővelheti. 
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Kitüntetett a jelentősége annak az csetnek, ha az adategységek valamely hiernr- 
chiába szérvezettek. Pl.: 


1. hierarchikus adatbázis rekordjai 
2. B"-fa elemei 


3. egymásba ágyazott adatelemek: ezek közül a legfontosabb n relációs 
adatbázis-reláció-blokk-tuple hierarchia. 


Kihasználva a hierarchikus szerkezetet, lehetőségünk van arra, hogy egy adotegy- 
ség zárolása esetén minden, a hierarchiában alacsonyabban lévő ndategységet is 
egyidejűleg zároljunk. Jól kihasználható cz egymásba ágyazott adatelemek €se- 
tén, Pl. a relációs adatbázisoknál, ha egy tábla minden sorát zárolni kell, akkor 
ez soronként igen költséges lehet, de — az előbbiek szerint - megoldható a táblára 
helyezett egyetlen zárral ís. 

Más hierarcbiák esetén, pl. B"-fáknál nem feltétlenül célravezető az előbbi straté- 
fia. Egy jó példa erre a fa protokoti, míg az előbbi megközelítésre a figyelmeztető 
protokollt. 


10.6.1. A fa protokoll (tree protocol) 


Az egyszerű tranzakció modellt követjük és egy csomópont 
zárolása nem jelenti a gyerekek zárolását is. (A) 
Szabályai: 

1. egy tranzakció az első LOCK-ot akárhová telteti (B) (e) 


2. további LOCK-ok csak akkor helyezhetők cl, ha az (D) CE) 
adategység szülőjére ugyanaz a tranzakció már rakott 


zárat 
3. egyazon tranzakció kétszer MEYANBSS az adategységet (e) (e) 
nem zárolbatja. 


Vegyük észre, hogy az UNLOCK-ra nincs előírás, aminek következménye, hogy a 
fa protokoll nem feltétlenül kétfázisú, mint pl. a következő példában sem: 
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1. LOCK A 
2. LOCK B 
3. USLOCK A 
4. LOCK E 


Ez a szekvencia a valóságban is gyakran előfordul, pl. amikor egy tranzakció be- 
szúrás műveletet hajt végre egy B"-fán. Ha B egy olyan csomópont, amiben van 
hely egy újabb indexrekord számára, akkor a fa átstruktúrálódása a beszúrás kö. 
vetkeztében a B csomópont őseít már nem érintheti, így a rajtuk lévő zár felsza- 
badítható, lehetővé téve, hogy más tranzakció zárolja a C csomóponthoz tartozó 
részlát. 


Tétel, A fa protokollnak eleget tevő legális ütemezések sorosíthatók. 


Bizonyítás. (vázlat) 
1. Rendeljük hozzá minden tranzakcióhoz egy irányított gráf egy csúcsát. 
2. Ebben a gráfban adott szabályok szerint rajzoljunk éleket. 
3. Bebizonyítjuk, hogy az Így rajzolt gráf DAG. 
4. Bebizonyítjuk, hogy a gráf minden topologikus rendezése az ütemezésnek 
egy soros ekvivalense, 
Fentiekből részletesebben csak na 2. pontot tárgyaljuk: 


Legyen Z(íT) az a csúcs (adategység), amit a Tf tranzakció elsőnek zárol. 


Ha E(T;) és E(T;) közül egyik sem őse a másiknak, akkor nem rajzolunk élt T; 
és T; között, hiszen a protokoll garantálja, hogy ekkor T; és T; sohasem fog közös 
csúcsot (nadntegységet) zárolni. 


T. f. h. tehát, hogy E(Ti) öse E(T;)-nek. 


- Ha T; zárolja először E(T;)-t, mielőtt T; zárolná, akkor egy 7; — T; élt 
rajzolunk a grófba (ugynnis a közös, E(T;) alatti adatokat ekkor T; fogja 
tudni először zárolni). 

- Ha T; zárolja először E(T5)-t, mielőtt T; zárolná, akkor pedig egy T; — 7; 
élt rajzolunk a gráfba. 





10.6.2. A figyelmeztető protokoll (warning protocol) 


Az egyszerű tranzakció modellt követjük, de egy csomópont 

zárolása a gyerek és az összes leszármazott csomópontok (A) 
zárolását is jelenti (utóbbi neve: implicit zár, implicit lock). 

Ez utóbbi feltételezés azonban azt ís eredményezheti, hogy (B) € 
két tranzakció tart fenn egyidejűleg zárat ugyanazon adat- 


egységen. Tekintsük az alábbi példát: (0) (E) 


180 (F) (s) 


1. Tr: LOCK E 
2. T2: LOCK A 


Ezután F-en és G-n 71) és 77 is (implicit) zárot tart fenn (valamint £-n T; implicit, 
Tt explicit zárat tart fenn). A jelenség neve zárkonfliktus (lock conflict), nmit 
alkalmas szabályok megtartásával el kell kerülni. 


A figyelmeztető protokoll zárműveletei: 


- LOCK A: zárolja A-t és az összes leszármazott csomópontot ís. Két különbő- 
ző tranzakció nem tarthat fenn egyidejűleg zárat ugyanazon ndategységen. 

- WARN A: A-ra figyelmeztetést (warning) rak. Ekkor A-t más tranzakció 
nem zárolhatja. 


- UNLOCK A: eltávolítja a zárat vagy az UNLOCK-ot kiadó tranzakció által 
elhelyezett figyelmeztetést A-ról. 


Szabályai; mint az egyszerű tranzakció modellben, továbbá 


I. egy tranzakció első művelete kötelezően LOCK gyökér vagy WARN győkér, 

2. LOCK A vagy WARN A akkor helyezhető el, ha A szülőjén ugyanaz n 
tranzakció már helyezett el WARN-t, 

3. UNLOCK A akkor lehetséges, ha A gyerekein már ugyanaz a tranzakció 
nem tart fenn sem LOCK-ot, sem WARN-t, 

4. kétfázisú: az első UÜNLOCK után nem következhet LOCK vagy WARN. 


Példa, 
n T3 (a) 
WARN A 
WARN A ís) do) 
WARN A 
WARN B (DD) (E) F) (c) 
LOCK C 
LOCK D 10.§. ábra. Az ndategységek 
UNLOCK C hierarchiája 
UNLOCK D 
UNLOCK A 
UNLOCK B 
LOCK B 
WARNC 
LOCK F 
UNLOCK A 


UNLOCK B 
UNLOCK F 
UNLOCK C 
UNLOCK A 
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Tétel. A figyelmeztető protokollt követő legális ütemezések zárkonfliktus- 
mentcsék (1) és sorosíthatók (2). 


Bizonyítás. 


1. A protokoll 1-3. szabályai biztosítják, hogy bármely 71 tranzakció csak ak- 
kor tehessen zárat egy adategységre, ha figyelmeztetés van annak minden 
ösén. Emiatt egyidejűleg más 72 tranzakció nem tehet zárat egy lockolt 
adntegységnek egyetlen ősére sem. Ahhoz pedig, hogy egy leszármazott 
ndategységre tehessen zárat T; az kellene, hogy ettől az adategységtől a 
gpökérig 72 figyelmeztetéscket helyezzen el. Azonban a figyelmeztetés biz- 
tosan nem helyezhető el arra az adategységre, amelyiken már T) helyezett 
el zárat, hiszen czek a zárműveletek nem kompatibilisek. Tehát nem ala- 
kulhat ki zárkonfliktus. 

. Megmutatjuk, hogy az adott R ütemezés átalakítható egy olyan ekvivalens 
§ ütemezésbe, amely az egyszerű tranzakció modellnek felel meg, és minden 
adategységet explicit módon zárolunk. 


5-et tehát úgy állítjuk elő, hogy 


1. eltávolítjuk az összes figyelmeztetést és UNLOCK párjait f-ből, 
2. LOCK X csetén explicit zárat helyezzünk X minden leszármaozottjára is, 
3. UNLOCK X esetén eltávolítjuk na zárat X minden leszármazottjáról. 


Ezek után S legális, mert Jt is legális volt, és az átalakítással sernmi olyat nem 
tettünk, ami miatt illegálissá válhatna, továbbá kétfázisú, mert R ís kétfázisú 
volt és az átalakítás során a kétfázisú tulajdonság megmaradt. Ezek elégséges 
feltételek 5 sorosíthatóságához. 









Megjegyzések. 


1. A WÁRN-LOCK kömpatibiílítási mátrix 
LOCK SWANN 
LOCK Í nem nem 
WARNÍ nem igen 
formailag azonos a RLOCK-WLOCK kompatibilitási mátrixszal. Ez azon- 
ban nem jelenti azt, hogy a WARN azonos lenne egy RLOCK-kal, hiszen 
más a szemantikájuk: a WARN hierarchikus adategységeken adott szabá. 
lyok szerint helyezhető csak el. 
2. Az RLOCK-WLOCK modellnek megfelelően értelmezhetünk hierarchikus 
adategységek esetén RVARN-t és WWARN-t is, ami a tranzakciós telje- 
sitmény további növekedését eredményezheti. 
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10.7. Tranzakcióhibák kezelése 


Mindeddig nem foglalkoztunk azokkal a problémákkal, amelyek akkor lépnek fel, 
ha egy tranzakció nem fut le teljesen, valamely ok miatt idő elölt befejeződik. 
Ahhoz, hogy hatékonyan kezelni tudjuk ezeket a hibákat, először gyűjtsük össze 
a lehetséges okokat. 


I. tranzakció félbeszakad (felhasználó megszakítja, 0-val osztás, nem fér hozzá 
valamely adategységhez), 

2. az ütemező patt miatt kilövi, 

,. az ütemező amiatt lövi ki, mert a sorosíthatóság így biztosítható, 

4. valamilyen rendszerhiba (system failure) tép fel, emiatt az adatbázis-kezelő 
hibásan kezd működni (szoftver és/vagy hardver ercdetű hibák egyaránt 
tartozhatnak ide), 

5. a háttértár tartalma (is) megsérül (médiahíbta, medium failure). 


u 


Az 1-3. hibákban közös az, hogy a mcmória- és a háttértár-siruktúrák érintet- 
lenek, ellentétben n 4-5. pontokhoz tartozó hibákkal. Rendszerhibáról beszélünk 
akkor, ha az operatív tár tartalma, a memória sérül. A legrosszabb, ha n háttértár 
tartalma ís károsodik, cz persze együtt ís járhat valamely memóriastruktúra sérü- 
tésével is. Ebben a sorrendben egyre bonyolultabb a reguláris működés biztosítása, 
az adatbázis konzisztenciájának fenntartása, nz adatvesztés elkerülése. A legsúlyo- 
sabb esetben már csak az segít, ba biztonsági másolatunk van az adatbázisról, és 
valahogy rekonstruálni lehet, hogy milyen változások történtek az adatbázison a 
legutóbbi mentés óta. 


Első lépésben csak azokkal a kérdésekkel foglalkozunk, hogy mi a teendő az 1-3. 
hibaokok csetén (ún. tranzakcióhíba, transaction failure). 


Definíció - konzisztens állapot fconsistent state). Az adatbázisnak olyan Álla- 
pota, amely csak teljesen lefutott tranzakciók batását tükrözi (Id. ACID tulaj- 
donságok, 10.1. szakasz). 





Mivel a tranzakciók idő előtt, í)). irregulárisan ís befejeződhetnek, az ndatbázis 
konzisztens állapotának fenntartása automatikusan nem fog megvalósulni. Olyan 
módszerekre van szükség, amelyek az egyes tranzakcióknak ezt a tulajdonságát 
biztosítják. Tranzakcióhibák csetén ezek a módszerek a készpont fogalmának bc- 
vezetésén keresztül érthetők meg. 


Definíció - készpont, commit pont (commit point). Az az időpillanat, amikor 


egy tranzakció futása során már minden befejeződött, ami a tranzakció 1-3. okok 
miatti abortját eredményezheti. 





Gyakorlatilag ez azt jelenti, hogy a tranzakció már minden számítást elvégzett, 
és minden zárat megkapott. Ekkor egy COMMIT utasítás szokott következni, de 
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cz az időpont még nem feltétlenül azonos azzal, amikor minden eredmény már 
véglegesítve ís lett. Ehhez további műveletek ís szükségesek lehetnek (ld. később), 
Ha viszont a tranzakció nem jutott el eddig a pontig, és ekkor abort következik 
be, akkor a tranzakciónak minden csetleges hatását törölni kell az adatbázisból 
(ndatértékek visszaállítása, zárak felszabadítása). 










Dcfiníció - piszkos adat (dirty data). Olyan adat, amit az előtt írt valamely 
tranzakció az adatbázisba, mielőtt commitált volna (Id. még a 10.2. szakaszban 
n piszkos olvasás jelenségét). 


A piszkos adat az adatbázisból mihamarabb eltávolítandó. Azonban előfordulhat, 
hogy egy másik tranzakció olvassa a piszkos adatot, és az a tranzakció már sikeres, 
Ennek ellenére, eredménye nem tekinthető helyesnek, így az adatbázisból ez is 
eltávolítandó. A jelenség iteráltan is előfordulhat, ekkor a jelenség neve lavina 


(cascading aborts). 





Példa. 

LOCK A 

READ A 

á4áz4A Il 

WRITE A 

LOCK B 

UNLOCK A 
LOCK A 
LOCK C 
READ A 
Cs Ax2 

READ B 
WRITE €C 
COMMIT 
UNLOCK A 

B : B/A 

ABORT 
UNLÓOCK C 


T) abortja után az alábbi tevékenységek végzendők: 


1. 7) által B-n fenntartott zárat az adatbázis-kezelő rendszernek kell eltávoli- 
táni. 

2. A eredeti értéke helyreállítandó, ehhez szükség van A régi értékére is. 

3. T2 rossz A-t olvasott, ezért T2 teljes hatása törlendő az adatbázisból (C régi 
értéke is helyreállítandó). 
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4. Ezután 73 újra lefuttatandó és minden más tranzakció is, nmely csetleg még 
olvasta időközben A értékét (redo). 


Láthatóan egy abortált tranzakció így sok járulékos költséget eredményezhet. 
Kezelése: 


- nem commitált tranzakciótól nem olvasunk, 

- ha megengedjük, akkor minden piszkos értéket olvasott tranzakció hatása 
törlendő az adatbázisból (undo), 

- lehetetlenné tesszük, hogy a tranzakciók piszkos ndatot olvassanak (ld. a 
szigorú protokollokat alább). 


10.7.1. Szigorú kétfázisú protokoll (strict two-phase locking 
protocol) 


A tranzakcióhibák kezelésének igen gyakori módszere. Egy tranzakció ezt a pro- 
tokollt követi, ha kétfázisú, továbbá 


1. nem ír az adatbázisba, amig a készpontját el nem érte, 
2. a zárait csak az adatbázisba írás után engedi el. 


Azaz a COMMIT, adatbázisba írás, zárak elengedése pontosan ebben a sorrendben 
következik. 


Vegyük észre, hogy az 1. szabály abboz kel), hogy ne kelljen az adatbázist helyreál- 
lítani, ha egy tranzakció abortál (csak redo kell). A 2. szabály biztosítja valójában 
azt, bogy piszkos adatot ne lehessen olvasni - hiszen commit után nem lehet nbort 
-, tehát a lavinákat elkerüljük. 


Mindez természetesen csak akkor ignz, ha nem kell rendszerhibákkal) is számolni, 
amelyek az írási folyamat megzavaorásával eredményezhetik, hogy piszkos adat 
kerül az adatbázisba. Ez ellen azonban más módszerekkel kell védekezni (naplózás, 
journaling, logging, Id. később). 


Ezután az alábbi tétel állítása csaknem triviális; 


Tétel. A szigorú kétfázisú protokollt követő tranzakciókból álló legális üteme- 
zések sorosíthatók és lavínamentesek. 


Bizonyítás. Az ütemezés sorosítható, mert kétfázisú; továbbá lavinümentes, 
mert nincs lehetőség piszkos adat olvasására. 





10.7.2. Agresszív és konzervatív protokollok 


A szigorú kétfázisú protokollok is valójában egy családot alkotnak, mivel számos 
alternatíva létezik még, amely az ülemezésekre hatással lehet (pl. egy tranzakció 
az összes zárját előre kéri, és csak akkor indul cl, ha már mindet megkapta). 
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Ezen alternatívák elsősorban annak alopján értékelhetők, hogy mennyire segítik 
elő az adatbázis-kezelő rendszer ,hatékony" konkurens működését. 


eilatékonyság" mércéje lehet pl.: 


- egy adott tranzakció minél hamarabb fusson le, 
— adott idő alatt minél több tranzakció fusson le sikercsen (tranzakciós telje- 
sítmény, transactional performance). 


Ezén kritériumok ellentmondásosak, adott esetben mindkettő lehet fontosabb a 
másiknál, mégis, gyakran a tranzakciós teljesítményt kívánjuk maximalizálni az 
ütemező és n protokoll alkalmas megválasztásával. 


Hogynn befolyásolják ezek a tranzakciós teljesítményt? 


a) Számos műveletet igényel a zártáblák kezelése, a zárakra várakozó sorok 
karbantartása, pattok érzékelése és feloldása, annak eldöntése, hogy a zár 
odaítélhető-e vagy sem, 

b) A később abortált tranzakciók által végzett műveletek mind kárbavesznek, 
csakúgy, mint az általuk igényelt és fel nem oldott zárnk felkutatása és fel. 
szabadítása, 

c) Nem szigorú 2PL csetén az adatbázis helyreállítása (undo), a lavinacítektus 
fdszámolása szintén csökkenti a tranzakciós teljesítményt. 


Definíció - agresszív protokoll (aggressíve protocol), optimista konkurenciake- 
zelés (optimistic concurrency control). Egy protokoll agresszív, ha megpróbál 


olyan gyorsan lefutni, amennyire csak lehetséges, nem törődve azzal, hogy ez 
esetleg aborthoz ís vezethet (keveset foglalkozik a)-val, azaz a zárakkal). 










Definíció — konzervatív protokoll feonservative protocol), pesszimista konku- 

renciakezelés (pessimistic concurrency control). Egy protokoll konzervatív, ha 
megkísérli elkerülni az olyan tranzakciók futtatását, amelyek nem biztos, hogy 
eredményesek lesznek (sokat fordít a)-ra). 





Példa (1). Egy nagyon konzervatív protokollt követő tranzakció 


1. szigorú 2PL, 

2. az összes zárat előre kéri és csak akkor indul, ha már az összeset megkapta, 

3. csak akkor kap meg egy zárat, ha az előtte senkinek nem kel) az adatelemhez 
tartozó várakozó sorban. 


Vegyük észre: 1. miatt sorosítható és lavinamentes, 2. miatt pattmentes, 3. miatt 
éhezésmentes az ütemezés. Ennek ára, hogy 


- 2. és 3. miatt nagy lehet a késleltetés, amíg egyáltalán a tranzakció elindul- 
hat, 
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- 2. és 1. mintt más tranzakciókat is szükségtelenül késleltet, 
- 2. miatt előre ismerni kellícne) minden zárat, 


Példa (2). Másik véglet: nagyon agresszív egy protokoll, hn n záraknt közvet- 
lenül Írás vagy olvasás előtt kéri. Amennyiben a zárnkat csnk azután engedi el, 
hogy mindet megkapta, akkor egyszerűen sorosítható, egyébként pedig n sorosít- 
hotóság biztosítása ís külön probléma lehet. Patt és éhezés is lehetséges, viszont 
a tranzakciók igen gyorsan lefuthatnak és a többi tranzakciót ís kevéssé fogják 
vissza. 


Választási szempont; ha kevés a iranzakciók által közösen hnsznált adat, akkor 
kicsi a nem sorosítható ütemezés, patt és éhezés veszélye, ilyenkor az ngresszív 
protokollok hatékonyabbak. 


10.8. Helyreállítás rendszerhibák és médiahibák után 


Eddig csak arról volt szó, hogy mi a teendő, ha egyes tranzakciók abortta) feje- 
zik be futásukat. A továbbiakban az előző szakaszban 4-5. pont nlatt szerepelt 
rendszerhibák és médiahbibák kezeléséről lesz szó. 


A rendszerhibák elleni védekezés általános módszere a (tranzakciós) naplózás. § 
A naplózásnak számos módja lehet, itt csak a leggyakoribbakra térünk ki. 


Definíció -— napló (journat, log). A napló a mi értelmezésünk szerint nz adat- 
bázison végrehajtott változások története. 


Általában az alábbi szerkezetű rekordokat tartalmazzo; 


a ((trnnzakció azonosító), begin) 

- ((tranzakció azonosító), commit) 

- ((tranzakció azonosító), abort) 

- ((tranzakció azonosító), (adntegység), (új érték), (régi érték)) 


Ha tudható, hogy undo műveleteket nem koll a napló alapján végezni, akkor elég az 
üdategység új értékének naplózása. Néha még ez ís túl nagy méretű, ekkor csetleg 
az kerülhet a naplóba, hogy hogyan kell az adotegység új értékét előállítani. 


Alapszabály, hogy a naplót azelőtt írjuk, mielőtt a naplózott műveletre sor kerülne 
ífkivétel: az abort művelet naplózása). 


§ Több, különböző célú napló is létezhet egy DBMS-ben, mint pl. a felhasználói bejelentkeztsek 
naplója, (egyes) adatelemekhez való hozzáférések naplója (audit Jog), üzemeltetési műveletek 
naplója, stb. Itt kifejezetten csak neról a naplóról van szó, amelyik az aeotbázison végrelmjtott 
változtatásokat tartalmazza (transaction log, redo log). 
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10.8§.1. Hatékonysági kérdések 


A helyreállítás képességének igénye miatt a napló stabil tárban (háttértáron, disz- 
ken) tárolandó. Ennek költsége — mint ismert, általában - a háttértárra írt napló- 
blokkok számával arányos. A gyakorlatban a naplóblokkokat valamilyen lapozási 
stratégiával kezelik. Számos napló oldal lehet egyidejűleg a memóriában és egy 
lapmenedzser göndoskodik a háttértárra kiírásról, meghatározott stratégia és (el- 

tétetek szerint, Tipikus, hogy ugyanez igaz az adatbázis blokkokra is. j 


Ha változtatunk az adatbázisunkon, a változás elveszhet egy rendszerösszeomlás 
csetén, ha a naplót vagy a megváltozott adatbázis oldalakat nem írjuk ki a stabil 
tárba, 

Hatékonyabb, ha a naplót írjuk, mert a napló tömörebben tartalmazza a válto- 
zásokat, mint maguk az adatbázis oldalak. Ekkor tehát kevesebb biokkműveletet 
kel! végeznünk. Ugyanakkor szabály, hogy egy tranzakció vége után a napló akkor 
is kiírandó a háttértárra, ha n Inpozási stratégia ezt még nem követelné meg, hi. 
szen ezáltal válik n tranzakció tartósan - akár megismételhetően - végrehajtottá 
(az ACID-ból a tartósság Így teljesül). 


Az adatbázis oldalakat tehet a naplótól függetlenül is, egy másik lapozási stratégia 
szerint cserélni. 


10.8.2. A redo protokoll (redo protocol) 


Nevét onnan kapta, hogy olyan tranzakciókezelést valósít meg, amely rendszerhiba 
(és tranzakcióhiba) után szükségtelenné teszi az undo műveletet, csak rcdo kell. 


A protokoll két része a rcdo naplózás és a redo helyreállítás. 


10.8.2.1. A redo naplózás (redo logging) 
A rcdo naplózás a szigorú 2PL finomítása. Lépései: 


1. (T, begin) naplóba, 

2. (T, A, (A új értéke)) naplóba, ha T megváltoztatja valamely A adategység 
értékét, 

3. (T, commit) naplóba, ha T elérte a commit pontját, 

4. a napló mindazon oldalainak stabil tárba írása, amikkel ez még nem történt 
meg, 

5. az A értékeknek a tényleges írása az adatbázisba (operatív tárba), 

6. a piszkos DB blokkok diszkre írása egyéb szempontok szerint, 

7. zárak elengedése. 





Megjegyzések. 


1. Az a tranzakció lett véglegesítve, amelyik eljutott a 4. pont végéig, hiszen 
a napló alapján az adatbázison végzett műveletei már bármikor megismé- 
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telhetők. A 4. pont végéig el nem jutott tranzakciók hatása pedig részben 
vagy egészben elveszhet. 

2. Az 5. pontban az adatbázisoldalak írásához az érintett blokkokat be kell 
hozni a memóriába, az írást elvégezni, de a megváltozott oldalnak azonnal; 
visszaírása a háttértárra már opcionális. 

3. A 7. pont után férnek hozzá csak más tranzakciók a T által megváltoztatott 
adatokhoz, így nincs Invinncffektus sem. 





10.8.2.2. A redo helyreállítás (redo recovery) 
Az adatbázist egy konzisztens állapotba viszi át a helyreállítás végére. 
Lépései: 

1. az ősszes zár felszabadítása, 


2. napló vizsgálata visszafelé: feljegyezzük azon tranzakciókat, amelyekre talá- 
lunk (T, commit) bejegyzést, 

3. addig megyünk visszafelé a naplóban, ameddig nem találunk egy konzisztens 
állapotot (ld. késöbb), 


4. a 2. pontnak megfelelő tranzakciókra vonatkozó bejegyzések segítségével az 
adatbázisban található értékeket felülírjuk az újakkal. 


A rcdo helyreállítás eredményeként a 2. pontnak megfelelő tranzakciók hatása 
megmarad, a többié elvész, és az adatbázis egy újabb konzisztens állapotba kerül. 


Ha a redo helyreállítás elszáll, akkor egyszerűen megismételendő, hiszen a 4. pont- 
ban végzett műveletek hatása nz adatbázisra idempotens (idempotent).? 


Példa. Egy redo protokoll szerinti tranzakcióra: 








tranzakció napló 

ő í(T, begin) 
LOCK A Ha út jön a rendszerhiba, nkkor a 
LOCK B helyreállítás során A és B értéke 

íT, A, v) változatlan marad. 

(T, B, w) 

(T, commit) §— Ezen a ponton a napló stabil tárba 
WIITE A írandó. Ha ezután jön a rendszerhiba, 
WRITE B akkor később a tranzakció már bármikor 
UNLOCK A helyreállítható. 
UNLOCK B 


? Az informatikában idempontensnek nevezünk egy műveletet, ha tetszőleges benenetre (adat- 
ra) egyszer vagy többször lefuttatva ugyanazt az eredményt ndja. 
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10.8.3. Ellenőrzési pontok (checkpointing) 


A redo helyreállításnál könnyen előfordulhat, hogy igen régi időpontra kell a nap- 
lóban visszafelé menni ahhoz, hogy alkalmas időpontot találjunk a helyreállítás 
megkezdésére. Ezen a problémán segítenek az ellenőrzési pontok, amikor kikény- 
szerítik az adatbázisnak egy konzisztens állapotát: 


1. ideiglenesen megtiltjuk új tranzakció indítását és megvárjuk, amíg minden 

tranzakció befejeződik vagy abortál, 

2. megkeressük azokat a memóriablokkokat, amelyek módosultak, de még nem 
kerültek a háttértárba kiírásra, 

3. ezeket a blokkokat visszaírjuk a háttértárra, 

4. ellenőrzési pont (checkpoint) tényét naplózzuk, 


§. naplót kiírjuk na háttértárra. 
Előnyök: 


. 


- rcdo helyreállításnál csak a legutóbbi ellenőrzési pontig kell a naplóban 
visszamenni, 

- emiatt a napló korábbi részei eldobhatók (amennyiben más érv nem szól ez 
ellen), 

— csökkenti a lavinák számát. 


IHátrány; 


— csökkenti n tranzakciós teljesítményt (többlet írások a háttértárra, tranzak- 
ció indítások késleltetése). 


Ütemezése: 


- ndótt idő eltelte után, 
- ndott számú tranzakció lefutása után, 
- kombinálva az előző kettőt. 


Mivel az ellenőrzési pontokra elsősorban a helyreállításkor van szükség, ez pedig 
ritka eseménynek számít, ezért ellenőrzési pontokat is viszonylag ritkán iktatnak 
be. Következmény: a helyreállítás tovább tart. 


10.8.4. Médiahibák elleni védekezés 


A tranzakcióhibák tárgyalása során az utolsó eset a médiahíbák (medium failure) 
kezelése, melyre a következő megoldások terjedtek el: 


- Rendszeres mentések (backup). Modern adatbázis-kezelő rendszerek ezt úgy 
hajtják végre, hogy egy pillanatnyi üzemszünetet sem okoz. 

- Az adatbázis fájlok duplikálása lehetőleg egy másik fizikai eszközön, néha 
más földrajzi helyen (ld. 11. fejezet). 
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Érdemes a napló (ájlokat is védeni: jó gyakorlat, ha az adatbázis és a napló más- 
más fizikai eszközön található. Szóba jön ítt is a duplikálás. 


10.9. Időbélyeges tranzakciókezelés (timestamp-basecd 
concurrency control) 


A tranzakciók sorosíthatósága biztosításának egy másik módja. Akkor praktikus 
elsősorban, ha a tranzakciók között kevés a potenciális sorosítási konfliktus, 


Az időbélyeges tranzakciókezelés során az adategységekhez egy (vagy néhány) 
járulékos adatot rendelünk hozzá (időbélyeg). Segítségével eldönthető, hogy egy 
tranzakció adott adategységre vonatkozó kérése sérti-e a sorosíthatóságot. Ha igen, 
ökkor a tranzakciót abortálni kell, így ez alapvetően egy agresszív protokoll. 


Definíció - időbélyeg ftímestamp). Olyan érték, amelyet minden tranzakcióhoz 
szigorú egyediséget biztosítva rendelünk hozzá, és amely arányos (legegyszerűbb 
esetben azonos) a tranzakció kezdőidejével. Jele; t( Tranrakctó). 





Figyelembe véve, hogy 


1, az időbélyegek a tranzakcióknak egy egyértelmű sorrendjét határozzák meg, 
továbbá, 

2. képzelhetjük úgy, mintha a tranzakciók a kezdőidejükben (csaknem) zérus 
idő alatt futnának le 


a kezdőidők növekvő sorrendjébe állítva a tranzakciókat ez tehet egy soros ekvi- 
valens ütemezés. 


Ha az időbélyeges ütemező tehát gondoskodik arról, hogy csak olyan műveleteket 
engedélyezzen, amelyek hatása a tranzakciók növekvő időbélyegei által meghatáro- 
zott soros ütemezés hatásaival egyezik meg, akkor a tranzakciók indulási sorrendje 
valóban egy soros ekvivalens ütemezés lesz. 





Megjegyzés. Érdemes összehasonlítani: soros ekvivaleng ütemezés kétfázisú zár- 
kezeléssel: a zárpontok szerinti növekvő sorrend a(z egyik) soros ekvivalens. Soros 
ekvivalens ütemezés időbélyegesen: a t(Tj)) c t(Tio) c... 2 t(Tin)-nek megfe 


lelő Tip s Zigv-ss Tin a soros ekvivalens, 





Az időbélyeges ütemező működése: 


I. megvizsgálja minden írás-olvasás előtt a hivatkozott adategység időbélyegét, 

2. ha ez a sorosítási szabályokkal összhangban van (Id. később), akkor az adaot- 
egység időbélyegét felülírja a műveletet végrehajtó tranzakció időbélyegével, 
ha nincs összhangban, akkor pedig abortálja a tranzakciót. 
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Időbélyegek kiosztása során az egyértelműség kritikus: 


— Egyproccsszoros környezetben a tranzakció indulásakor a rendszeróra által 
mutotott érték jó alap az időbélyeg meghatározásához. 

- Többprocesszoros (akár elosztott) környezetben ehhez még a processzor 
(vngy csomópont) azonosítója is hozzávcendő (Id. 11.3. szakasz). 


A sorosítási feltételek megsértése többféle modell alapján is detektálható, Itt is 
létezik: 


- egyszerű modell, 
- read/write modell, 
- és további műveletek is megkülönböztethetők. 


10.9.1. Időbélyeges tranzakciókezelés R/W modellben 





Definfció - olvasási és írási idő. 


- R(A); az adategység olvasási ideje, annak a tranzakciónak az időbélyege, 
amely legutóbb olvasta az A adategységet. 

- W(AY az ndatégység írási ideje, annak an tranzakciónak az időbélyege, 

amely legutóbb írta az A ndntegységet. 


Az alábbi táblázat alapján eldönthető, hogy egy tranzakció műveleti igénye az A 
adategységre vonatkozóan engedélyezhető-e vagy sem, azaz az időbélyeges soros 
ekvivalensnek megfelel-e, 


t [ T olvasni akar t T írni akar 


tíT) c R(A) ÍJ abort T (1) abort T (2) 

































t(íT) c W(A) 

i(T) c MA) ÍT olvassa A-t, abort 7 (4) 
tíT)y 5 W(A) j de R(A) nem változik (5) 

17 ea KARA 
t(T) c W(A) 





ÚT) 5 R(A) ÍT olvassa A-t és 
UT) 5 IV(A) [ R(A) :— t(T) 


T írja A-t és 
W(A) :z tíT) 


Magyarázat: 


(1) egy később indult tranzakció már írta A-t, tehát nem olvashatjuk, 

(2) egy később indult tranzakció már olvasta A-t, tehát nem írhatjuk, 

(3) egy később indult tranzakció már olvasta A-t, ettő) még T is kiolvashatja, 
de az időbélyeget a későbbi értéken kell hagyni, 

(4) ugyanaz, mint (2), 

(5) ugyanaz, mint (1), 
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(6) egy később indult tranzakció már Írta A-t, így T nem Írhatja felül, aznz 
T-nek abortálnia keli.§ 





Megjegyzések. 


1. Az időbélyeg tesztelése és maga a művelet oszthatatlan kell, hogy legyen. 
2. A fenti táblázatban a t(T) — W(A) vagy HT) — R(A) teljesülése nyilván 
akkor következhet be, ha moga 7 írta vagy olvasta legutóbb A-t. 


Összefoglalva: 
1. abort T, ha T olvasni akar és t(T) c WA) vagy T Írni akar és tíT) c AA) 
vagy t(T) c W(A), 
2. a READ művelet elvégzendő, ha t(T) 2 W(A), 
3. WRITE elvégzendő, ha t(T) 2 R(A) és tí(T) 2 IV(A). 
(2-3. esetén egyidejűleg az időbélyegek is beállítandók, kívéve, ha T olvas és t(íT) c 
R(A)) 
Példa. 






időlílyegek 

RTAJ 7-0, WTAJ 0 
(TM) 5 RA) e(T) 2 IVA) tehát olvashat és R(A) :— 50 
(To) 5 R(A) EÉT3) 5. IV(A) tehát olvnshat és A(A) :z 60 











t(r2) 5 60 


READ A 





A:z4A6t1 

A:24£I1 

WNITE A t(T;) s M(A), ert) 5 HW(A) tehát Írhat és IV(A) :— 60 
WRITE A tíTp) c RA). (TT) 2 IWV(A) tehát abort 77. 
nbort T; 


10.0.1.1. Az időbélyeges RAW modell és a 2PL összehasonlítása 
Elképzelhető, hogy egy ütemezés sorosítható 


- időbélyegesen, de kétfázisú zárakkal nem (Példa 1), 


- íidőbélyegesen is és zárakkal is (pl. minden olyan útemezés, amelyben a tranz- 
akciók nem használnak közös adatokat), 


- kétfázisú zárakkal, de időbélyegesen nem (Példa 2), 
a jdőbélyegesen sem és zárakkal sem (Példa 3). 


Példa (1). Az időbélyeges protokoll szerint sorosítható (a megadott időbélyegek- 
kel), de aíz RLOCK-WLOCK zárakat használó) 2PL protokoll szerint nem. 


Az ütemezés nem sorosítható a 2PL szerint, mert ahhoz, hogy a megadott sor- 
rendben fusson le, 72-nek a (2) és (3) lépések között el kell engednie az A-n tartott 
zárat, majd a (4) és az (5) lépések között zárolnia kell B-t, így 72 mindenképpen 
sérti a kétfázisú protokollt. 


§ A konkurencia növelése további ötletekkel lehetséges, Id. pl. 67, felodat (254. oldal) 
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n 





Példa (2). A 2PL protokoll szerint sorosítható, de időbélyegesen (a megadott 
időbélyegekkel) nem. 
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Ty Ti 





Időbélyeges protokoll szerint történő futtatás esetén Tj a (3) pontban abortál, 
mert t(T)) c W(B) — tíT9). 


Az ütemezés kétfázisú zárakkal sorosítható: 











WLOCK B 
(4) WRITE 8 
(5) UNLOCK B 
(6) Í RLOCK B 
(7) I! READ 8 
(8) I UNLOCK A 
(9) [ UNLOCK 8 
Soros ekvivalense a T2, Th ütemezés. 
T 






WRITE B 
(2) 
(3) ÍRBAD B 


Példa (9). Nem sorosítható sem időbélyegesen, sem a 2PL protokoll szerint. 










Ti 1 
(Th) s 10 t(T2) — 20 
(1) READ A 
(2) [ WRITE A 
(3) WRITE A 


Kétfázisú zárakkal nem sorosítható, mert T3-nek az (1) és (2) lépések között el kell 
engednie az A-n tartott (RLOCK) zárat, majd a (2) és (3) lépések között zárolnia 
kell (WWLOCK). Ez sérti a kétfázisú protokollt. Időbélyeges futtatás esetén a (2) 
pontban abortál, mert tíTj) c R(A) — t(T2). 


Tanulság; sem a zárakkal, sem az időbélyegekkel való sorosítás nem jobb egyér- 
telműen a másiknál. 
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10.9.2. Időbélyegek kezelése 
Zár alapú tranzakciókezelésnél praktikus megközelítés, ha 


- külön tároljuk a zárinformációt az adategységektől (zártábla, lock table), és 

- feltételezzük, hogy az adategységek alapértelmezett állapota snem zárolt". 
"Tehát a zártáblában csak azokról az adategységekről tárolunk információt, 
amelyeken van zár. 


Analóg módon: időbélyeges esetben az adategységek alapértelmezett időbélyege 
lehet —oo, és csak az ettől eltérő értékeket kell explicit módon tárolni, Ezek az 
értékek megjelenhetnek közösen egy időbélyegtáblában, ami lehetőség szerint a 
memóriában tárolandó. A tábla nem nő a végtelenségig, mert a táblából kitöröl- 
hetők azok az időbélyegek, amelyek kisebbek, mint a futó tranzakciók legkisebb 
időbélyegének az értéke. 


10.9.3. Tranzakcióhibák és az időbélyegek 


Elképzelhető, hogy 72 olvas T) által előállított értéket, majd késöbb T) abortál 
bármely (korábban 1-3. pontok alatt hivatkozott) ok miatt. Ez a piszkos adat 
olvasásának esete, amikor tehát lavínaveszéllyel kell számolni. 


A megoldás: 


1. elfogadjuk a Invinákat, hiszen az időbélyeges tranzakciókezelést tipikusan 
olyan környezetben használjuk, ahol kevés az abort, tchát a Invina még ke 
vesebb, vagy 

2. megakadályozzuk a piszkos adat olmsását pl. azza), hogy nem írunk az adat- 
bázisba, amíg a tranzakció el nem érte e készpontját (Id. időbelyeges szigorú 
protokott, timcstamp-based strict protocol). 


Lépései az alábbiak tennének: 


1. módosítások csak munkaterületen elvégezve 
2. tranzakció eléri a készpontját 
3. írások véglegesítése az adatbázison 


Az írásokkal azonban baj van: 


ESEL EENKKKKKKKKKKtReeeeeet.t—— ee. 
Írás, olvasás, ehhez készpont írás idő 


időbélyegek ellenőrzése az adatbázisba 

10.6. ábra. Lavina megelőzése időbélyeges tranzakciókezelés esctén 
Az időbélyeg ellenőrzése a készpont előtt kell, hogy történjen, hiszen utána már a 
tranzakció akkor sem abortálhat, ha az időbélyegek vizsgálatából ez következne. 


Igy azután egy írandó adatelem időbélyegének ellenőrzése és tényleges írása között 
jelentős idő telhet el, ami problémát okozhat: 


196 


T. fh. t(T) — 100 és T írni akarja A-t. Legyen R(A) z WW(A) z 60 az írás előtt, 
tehát T írhat (a munkaterületen). Ha jönne egy Ty tranzakció a készpont előtt, 
ahol (Ti) — 80 és olvasni akar, akkor 


- olvashat (helytelenül), amennyiben nem állítjuk be A időbélyegét az Írással 
egyidőben, 

- nem olvashat (helyesen), amennyiben beállítjuk A időbélyegét az írássni egy- 
időben IV(A) — 100-ra. 


Tehát elvégeztünk egy írást A-n, ennek megfelelően beállítottuk az Írási időbélye- 
gét, de A megváltozott értékét más tranzakciók mégsem látják, mert csak mun 
katerületen történt az írás. 


Megoldás; a tényleges írásíg A-ra zárat kell tenni. Ha T közben abortál, akkor a 
zárat e) kell engedni és IV(A) értékét helyreállítani. 


További alternatívák: 
a) akkor ellenőrizzük az időbélyegeket, amikor az írási/olvasási igény megjele- 
nik, 
8) közvetlenül a készpont előtt ellenőrizzük az időbélyegeket. 


Az a) csetben (pesszimista stratégia) a zárak hosszabbak, de az abort valószínű- 
sége kisebb, míg a 42 csetben (optimista stratégia) éppen fordítva van. 


10.9.4. Verziókezelés időbélyegek mellett (MVCC) (multi-version 
concurrency control) 
Teltételezés: minden adatelem írásakor a régi értéket is megőrizzük. 


Kézenfekvő megoldás, ha idősor jellegű adatokat kívánunk tárolni (betegek adatai, 
tözsdei árfolyamváltozások, szoltver projektek verziói stb.). 

Fizikai megoldás: pl. egyszer Írható optikai diszkek, 

Segít. az időbélyeges tranzakciókezelés mellett az abortok számát is csökkenteni, 
ha a verzió keletkezési idejét (értsd: időbélyegét) is tároljuk. 

T. fh. T tranzakció olvasni akarja A-t, Abort T kellene, ha t(T) c W(A). 
Amennyiben rendelkezésre áll A-nak az az A; verziója ís, amelyre tíT) 5 W(A;) 


és az ilyen tulajdonságú A;-k közül ez a legkésőbbi, akkor T olvashatja A;rt és 
mehet tovább. 


Probléma: ha a T tranzakció írni akarja A-t, akkor abort T kell tíT) c AR(A) 
esetén. Verziók esetén csak akkor kell abort, ha van egy A; változat, amelyre 
W(A;) c tíT) cz R(A;) (hiszen annak a tranzakciónak, amely 4;-t olvasta, való- 
jában azt az értéket kellett volna olvasnia, amit T hozna létre). 


Példa. 


(19: A verziók tárolása nélkül ítt 71-nek abortálnia kellene, így viszont By olvasása 
belyett Bg olvasásával Tj továbbmehet. 
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Tt 


aTja 18 
READ A 









READ A (3) 
WTNITE 5 











HEAD §1) 
WRITE A (2) 


(2): mivel Ti korábban indult, f2-nek feltétlenül Ti által írott értékeket szabad 
csak olvasnia. Ezzel szemben (3) alatt Tz ezt megsérti (van egy változat, i — 0, 
amelyre IV(A;) c t(T) c R(A;)), ezért Ty mégis aborira kényszerül. 


Összefoglalva: 


— alapvetően konzervatív módszer (pesszimista stratégia), 

- hatékonyan támogatjn a sok/hosszú olvasási tranzakciókat, 

- több háttértárat igényel, 

-— bonyolultabb adatvisszakéresési algoritmus, 

- n DBMS-nek kell felderítenie, ha egy verzió a futó tranzakciók számára már 
közömbös, így törölhető (akkor persze, ha egyéb okból nincs rá szükség). 


10.9.5. Időbélyeges módszerek áttekintése 


zárok abort helyreállítás hátrány 


D—nne] Tehet [/dvinalehet [helyreállítás 
hosszabb időre Tehet] redő 1 
[rövid időre gyakoribb] redo 






általános 
-Desszimista" 
Optimista" 
verziók 
















elesleges 
értékek eltávolítása 


10.10. A fejezet új fogalmai 


többfelhasznátós, ilt. konkurens működés, fantom olvasás, nem megismételhető 
olvasás, elveszett adatmódosítás, piszkos adat olvasása, ÁCID, atomicitás, adat- 
bázis konzisztencia, tranzakciók izolációja, tartósság (durability), zár (privilégi- 
um, szinkronizációs primitív), patt (deadlock, holtpont), éhezés, várakozási gráf, 
zármódok, tranzakció modell, ütemezés, sorosZnem soros, ill. sorosítható/nem s0- 
rosítható ütemezések, soros ekvivalens, sorosítási (precedencia) gráf, zár kompa- 
tibilítási mátrix, (zár)protokollok, 2PL, időbélyeg, soros ekvivalens időbélyeges 
tranzakciókezelés esetén, tranzakciós teljesítmény, agresszív protokoli, konzeérva- 
tív protokoll, tranzakcióhiba, rendszerhiba, médiahiba, kész (commit) pont, hely- 
reállítás (recovery), tranzakciós napló, redo, undo, checkpoint, szigorú protokoll, 
redo naplózás, redo helyreállítás, MVCC, szigorú időbélyeges tranzakciókezelés 
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11. fejezet 


Elosztott adatbázisok 


Definíció - elosztott adatbázis (distributed database). Csomópontok (nodcs, 
sítes) összessége, amelyekben egy-egy számítógép üzemel saját CPU-val, hát- 
tértárral és adatbázis-kezelővel." A csomópontok egymással össze vannak kötve 
adatcserére alkalmas módon úgy, hogy az adatbázis-kezelők felhasználói csupán 
egyetlen, logikailag egységes adatbázist érzékelnek, 


: Az adatbázis-kezelők természetésen autonóra módon is képesek működni 


Sebezhetőbb az elosztott rendszer, mert a csomópontokon kívül a linkek változntos 
hibái is befolyásolhatják a működést. Ezért a megbízható működés fenntartása 
fontos szémpont. Módszerek: 


I. adatok multiplikált tárolása, különböző fizikni helyeken (ez az ndatelérés 
idejét is csökkentheti) 

2. linkek hibái ellen többszörös elérési utnak biztosítása n hálózatban 

3. nagy megbízhatóságú komponensek alkolmazása. 


Az IL. csetén problémaként merül fel n másolati példányok írásának kérdése, amely 
atomi kell, hogy legyen minden másolatot beleértve. Külön megfontolást igényel 
az az eset, amikor egy csomópont elérbetetlen, ilyenkor ugyanis az adatbázis mű- 
ködése nem állhat meg. 


Definíció - globális (logikat) adat (global data unit). Egyetlen logikai egységnek 
számít az egész elosztott adatbázis szempontjából, valójában részekből éllbat, 


tipikusan fizikailag különböző helyeken. Ezek a részek a lokális (fizikat) adatok. 





A fizikai adatok lehetnek másolatok (megbízhatóság, gyorsabb elérés) és/vagy 
egy nagyobb adategység különböző részei is (ha pl. egy közigazgatási adatokat 
tartalmazó reláció n-esei különböző megyei szervekhez tartozó csomópontokon 
tárolódnak). 
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Fontos elv; n műveleteket logikai egységeken fogalmazzuk meg, hiszen kifelé nem 
látszanak a lokális adatok, de n valóságban lokális adatokon végzett műveletekre 
kell ezeket visszavezetni. 


Példa (1). Egy Íglobális) adatelem zárolása egyetlen logikai művelet (aminek 
rándásul oszthatatlannak kellene lennie), amely a lokális adategységekre visszave- 
zetett fizikni zárakon keresztül valósul(hat) meg. Eközben jelentős idő telhet el! 
A felmerülő problémákat Id. 11.1. szakasz. Jelölés: ha A a logikai adatelem, akkor 
Aj:k a fizikai ndatelemek. 


Példa (2). Hasonlóan: egy giotális (logikai) tranzakció a valóságban különbö- 
ző csomópontokban futó fokális ffizikai) trunzakciókon keresztül valósul meg. A 
fizikai tranzakciók kezelik a lokális adatokat. A globális tranzakciókra megfógal- 
mazott (pl. atomiságra, sorosíthatóságra vonatkozó) követelmények is a lokális 
tranzakciók révén teljesülhetnek (Id. II.2. szakasz). Jelölés: ha 7 a globális tranz- 
akció, akkor T;-k a lokális tranzakciók. 


11.1. Elosztott zárak 


A lokális példányokon a zárakat úgy kell elhelyezni, hogy támogassák a globális 
példányok zárolását, 


Az R/W modellben ha egy 7; tranzakció WLOCK Ay műveletet eredményez, 
akkor egyetlen más lokális tranzakció sem helyezhet semmilyen zárat A egyetlen 
lokális példányára scm. 


Másrészről, ha csak egyetlen másolat létezik valamely adategységről, akkor a glo- 
bális zárkezelés megegyezik a lokális zárkozeléssel, azaz a globális zárkezelés pon- 
tosan akkor korrekt, nmikor n lokális zárkczelés korrekt. 


Lefolyása: az N; csomópontbeli T; tranzakció zárolni akarja az A adategységet, 
amelynek egyetlen Ay példánya az Ny, csomópontban van. Ezért az N-ből egy üze 
net megy A-ba, nbol nz ottani zármenedzser eldönti a zárkérés teljesíthetőségét 
és az eredményről visszaüzen az N; csomópontba. 


Több jokális példány esetén számos lehetőség van, ahogyan a globális zárkérések 
lokális zárkérésekké lefordíthatók. 


Ezek a protokollok különbözhetnek a 


a bonyolultságukban és 
- az üzenetek számában. 


Az üzenetek lehetnek 


- kontrollüzenetek, melyek rövidebbek, olcsóbbak vagy 
- adatűzenetek, melyek hosszabbak, így drágábbak. 
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12.2.1. A WALL (write locks all) protokoll 


A zárak és szemüntikájuk a lokális példányokon pontosan megegyezik az RZW mo- 
dellnél megismerttel. Globális adategységeken ezután zárakat az alábbiak szerint 
értelmezünk: 


1. RLOCK A érvényes, ha RLOCK A; érvényes A-nak legalább egy példányán 
2. WLOCK A érvényes, ha WLOCK A; érvényes A-nak az összes példányán. 


A WALL protokotl globális zárkompatibilítási mátrixa az alábbi 


RLOCK WLOCK 
RLOCK igen nem 
WLOCK nem nem 


Azaz formailag megegyezik a lokális adategységekre értelmezett zárkompatibilitási 
mátrixszal. Ezt a továbbiakban bizonyítjuk. 


Tétel, A WALL protokoll globális zárkompatbilitási mátrixa megegyezik n lo- 
kális adategységekre értelmezett zárkompatibilitási mátrixszal. 

Bizonyítás. 

A fenti protokoll következtében két különböző tranzakció nem tarthnt fenn 


WLOCK-ot ugyanazon logikai adategységen. Ia Ti. már zárolta A-t, akkor az 
összes An Tt: WLOCK A; érvényes kell, hogy legyen, így T; nem tud egyetlen 
Ayre sem (sem író, scm olvasó) zárat rakni. Emiatt 74: WLOCK A nem kompa- 
tibilis sem Tt: WLOCK A-val, sem Tp: RLOCK A-val. Másrészt, ha Tt: RLOCK 
A érvényes, akkor Ty: RLOCK A; áll fenn valamely A;-rc, amely komnatibilis 
Ty RLOCK A;-vel, tehát Tt RLOCK A kompatibilis Ty: RLOCK A-val. 





A WALL hatékonysága a szükséges üzenetváltások számával mérhető le. 
Feltételezések, melyeket későbbi módszereknél! is alkalmazni fogunk: 

- n db csomópontban van példány az A adategységből, 

- ismert az, hogy hol találhatók (melyik csomópontban) a lokális példányok. 
Hozzávetőleges analízis: 


A globális WLOCK-hoz tehát n csomópontba kell kérés- (kontroll-) üzenetet kül- 
deni, innen n válasz érkezik, majd - ha mind pozitív volt - n helyre kell A új 
értékét szétküldeni. Szükséges lehet még n db UNLOCK űzenet, de ez megtaka- 
rítható az elosztott készpont képzése során (ld. 11.2.3. alszakasz). 


A globális RLOCK-hoz elég egyetlen csomópontba kontrollüzenetet küldeni (tud- 
juk, hol vannak a példányok, ezekből egy tetszés szerint kiválasztható), innen 
pozitív válasz esetén egyetlen adatüzenet küldendő. 
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11.1.2. Többségi zárolás (majority locking) 


Feltételezések a lokális zárakról: mint a WALL protokolinál. Globális adategysé- 
geken ezután zárokat az alábbiak szerint értelmezünk: 


1. RLOCK A érvényes, ha RLOCK A; érvényes A lokális példányainak több- 
ségén, 

2. WLOCK A érvényes, ha WLOCK A; érvényes A lokális példányainak több- 
ségén. 


Tétel. A globátis zárkompatibilitási mátrix azonos a WALL protokoll mátrixá- 
val. 


Bizonyítás. 


- Tr: WLOCK A; (lokálisan) nem kompatibilis Tr: WLOCK Ajrval, így egy- 

, időben nem lehet A lokális példányninak többségét zárolni. Emiatt (a glo- 
bális) Ty: WLOCK A nem kompatibilis Tj: WLOCK A-val. 

- Tr; WLOCK A nem kompatibilis Tt: RLOCK A-val, mert. Tr: WLOCK 


a-hoz A példányainak többségén WLOCK van, ami nem kompatibilis 
RLOCK-kal, így a többségen már nem lehet RLOCK, Emiatt T.: WYLOCK 
A nem kompatibilis 7: RLOCK A-val és Ti: RLOCK A nem kompatibilis 
Ti: WLOCK A-val, 

- Tk: RLOCK A; kompatibilis 74: RLOCK A;-vel, így egyidőben több tranz- 
akció is zárolhotja az A;-k többségét, és globálisan Tx: RLOCK A is kom- 
patibilis Tt: RLOCK A-val. 





A többségi zárolás hatékonysága: 


WLOCK A létesítéséhez legalább az n példány többségének, ((n -- 1) /2] példány- 
nak kell kontroltüzenetet küldeni, legalább f(n 4 1) /2] válasz- (kontroll-) üzenet 
jön vissza, majd n adntüzenettel mindegyik lokális példányt írni kell. 


RLOCK A-hoz legalább [(n -- 1) /2) csomópontnak kell kontrollüzenetet küldeni, 
amelyre [ín 4 1) /2) válasz érkezik. A válaszokból (legalább) az egyik adatüzenet, 
ez tartalmazza a kért adategység értékét. 


Hozzávetőleges összehasonlító táblázat a WALL-lal (számos részlettől eltekintet- 
tünk): 


j adat üzenet I kontroll üzenet 


WALL írás 2n 
többségi írás 
WALL olvasás 
többségi olvasás 
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Konklúzió: ha sok az olvasás, akkor a WALL, ha az írás több, akkor n többség! 
zárolás hatékonyabb az üzenetek száma alapján. 


Más szempont; ha két tranzakció azonos adategységet akor közel egyidőben zá- 
rolni, akkor WALL csetén valószínűleg patt lesz az eredmény (aminck a feloldása 
költséges), többségi zárolásnál pedíg az egyik sikercs lesz, a másik pedig nem 
(abort vagy várakozás). 


11.1.3. k az n-ből protokoli 

Ez a módszer az előző kettő általánosítása. 

n s csomópontok száma, továbbá E kén 
Szabályai: 


1. WLOCK A érvényes, ha WLOCK A; érvényes k db lokális példányon, 

2. RLOCK A érvényes, ha RLOCK A, érvényes (nt 1— k) db lokális példá- 
nyon. 

3. k z n esctén megfelel a WALL protokollnak, k — [eg] csetén pedig a 
többségi protokollnak. 


k alkalmas megválasztásával a protokolt ,hangolható". 


11.1.4. Elsődleges példányok módszere 


Az eddig megismert protokolloknál a lokális adategységek felett az egyes cs0- 
mópontok zármenedzserei rendelkeztek. Egy globális zár elhelyezéséhez ismerni 
kellett, hogy hol találhatók sz nadategységek példányni és czek csomópontjai közül 
sszámosnak" kellett üzenetet küldeni. Javíthat a zárkezeiés hatékonyságán, hogy- 
ha egy A adategység minden példányának elérhetőségét egyetlen XA csomópont 
zármenedzsere felügyeli. A különböző adategységekre cz 6 csomópont általában 
különböző, és üpíkusan olyan csomópont, amelyen van a kiválasztott ndategység- 
nek másolata (ez lesz az A adategységnek az elsődleges példánya). 


Hatékonysága: 


1. WLOCK A-hoz kell egy kérés- (kontroll) üzenet X4-ba, erre jön egy válasz, 
majd (jó esetben) írandó A-nak mindegyik másolata. 

2. RLOCK A-hoz kell egy kontrollüzenet X4-ba, erre jön egy válasz, majd 
kiolvasható A-nak valamely másolata. 


Tehát sokkal hatékonyabb, mint az előbbiekben megismertek, hiszen a kontroll- 
üzenetek száma konstans, nem n-nel arányos. Viszont sebezhetőbb, mert egy adat- 
egység egyáltalán nem elérhető, akárhány másolata ís van, ha az X4 csomópont 
kiesik, Az elsődleges példány így tehát egyszeres hítdopont (Single Point of Failure, 
$POF). 


Az ís elképzelhető, hogy mindegyik adategység felett ugyanaz a csomópont ren- 
delkezik (centrális csúcs módszere). Ebben az esetben az adategység elsődleges 
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példánya nem biztos, hogy a centrális csúcson helyezkedik el, ekkör a centrális 
csúcs és nz elsődleges példány között íráskor és olvasáskor plusz egy kontroll üze. 
net küldése szűkséges. 


11.1.5. Elsődleges példányok tokennel 

Ez a protokoll az elsődleges példányok módszerének továbbfejlesztése olyan mó- 
don, hogy egy adategység elérését kontrolláló csúcs kijelölése dinamikusan változ- 
hat. 

Minden A adategységhez értelmezünk egy írási WT(A) és egy olvasási RT(A) 
tokent, amelyek az adatogység elérését szabályozzák. Ha létezik WT(A), akkor 
nem létezhet RT(A), ha nincs WT(A), akkor viszont akárhány RT(A) létezhet. 
A tökenek szemantikája: 


Ha az X csomópontban van a WVT(A) token, akkor az X csomópont zármenedzsere 
jogosult az RLOCK A-t vagy WLOCK A-t megítélni az X csomópontban futó 
(globális) tranzakciók számára. 


Han az X csomópontban van az RT(A) token, akkor az X csomópont zármenedzsere 
jogosult nz RLOCK A-t megítélni az X csomópontban futó tranzakciók számára, 


Amennyiben pl. egy tranzakció az Y csomópontban a 3 adategységet írni akarja, 
akkor ehhez WT(D)-t az Y csomópontba kell juttatnin. Ha nem lenne ött, akkor 
ezt üzenetváltásokkal érheti el: 


Y-ból WT(DB)-t kérő üzeneteket küld mindegyik (m db) csomópontba, amely az 
elosztott adatbázishoz tartozik 5 m db kontróllűzenct 


A csúcsok válaszolnak a) vagy b] üzenettel (a m db kontrollüzenct), mégpedig: 

- akt válaszolnak, ha nincs náluk sem RT(B), sem WT(B), vagy náluk van 
ugyan, de lemondnnak róla, 

— 0])-t válaszol egy csúcs, ha nála van RT(D) vagy WT(B), és kell is neki (tehát 
nem engedi át a tokent, mert pl. még használja vagy már más csomópontnak 
ígérte). Ekkor a csúcs megjegyzi a kérést. 

Ezután az Y csomópont összegyűjti a válaszokat; 


- Ha mindenki a)-t üzen, akkor Y tudja, hogy a tokent megszerezheti. Ezért 
üzeneteket küld minden csomópontba, hogy semmisítsék meg a B-re vonat- 
kozó tokenjüket. 


- Ha valaki 6])-t üzen, akkor Y visszavonja a kérését azoktól a csomópontoktál, 
akik a)-t válaszoltak. 


Ez legfeljebb újabb m db kontrollüzenetet jelent, 
Az RT(B) megszerzése hasonló: 
Y-ból RT(B)-t kérő üzeneteket küld mindegyik csomópontba. 


- A csomópontok nem válaszolnak, ha RI(B) van náluk, vagy 


204 


- a csomópont a) vagy b) üzenettel válaszol, mégpedig: 
akt válaszol, ha nincs nála WT(B), vagy nála van ugyan, de lemond róla, 
b)-t válaszol, ha nála van WT(B), és kell is neki. Ekkor n csúcs megjegyzi n 
kérést. 


Ezután az Y csomópont összegyűjti a válaszokat: 


- Ha csak a) jött, akkor Y tudja, hogy szerezhet RT(B)-t. Ezért üzeneteket 
küld azokba a csomópontokba, ahonnan a) jött, hogy semmisítsék meg a 
WT(B) tokent. 

- Ha valaki b]-t üzen, akkor Y nem tud RT(B)-t szerezni, 


Értékelés: a token mozgatása nagyon költséges, de ha a token már a megfele- 
lő csomópontban van, akkor az újabb iranzakcióknál n tokenmozgatás járulékos 
költsége már zérus. A módszer tehát adaptív. 


11.1.6. Összefoglaló 


A zárkezelési protokolloknál a kontrollüzenetek szükséges száma a 11.1 táblázat- 
ban látható, ahol m az elosztott rendszer csomópontjainak száma, n csomápont- 
ban van példány az A adategységből. Az ismertetett módszerek csak a zároláshoz 
szükséges kontrollüzenetek számában különböznek, az adatüzenetek száma mind- 
egyik esetén íráskor a, olvasáskor 1. 


köntrollúzenet GSlSGyzÉs 
íráskor ] olvasáskor [ ""8egY 


WALL jó, ha sok az olvasás 
többségi zárolás I2nál] 2n jó, hasok az írás 
elsődleges példányok EF HE BE UN hatékony, de sebezhető 
elsödleges példányok tokennel KEZELNI ZEL NI adaptív 


centrális csúcs nagyon sebezhető, 
centralizált hálózati 
forgalmat okoz 





II.I. táblázat. A zárkezelési protokolloknál a kontrollüzenetek szükséges számn 


11.2. Elosztott tranzakciók problémái 


A cél a tranzakciók atomiságát és sorosíthatóságát elosztott környezetben ís biz- 
tosítani. Ehhez rendelkezésre állnak a íglobális) zárak és változatos protokollok, 
amelyek nem egyszerű kiterjesztései a nem elosztott környezetben működő proto- 
kolloknak. 





Definíció - elosztott sorosíthatóság (distributed seriatizabílíty]). Tranzakciók egy 
ütemezése egy elosztott adatbázison sorosítható, ha hatása a logikai adategysé- 
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geken ugyanaz, mintha a tranzakciók valamely soros ütemezésben futottak volna j 
le, azaz mindegyik logikai tranzakcióhoz tartozó fizikai tranzakció ís befejeződik, 
mielőtt n soros ekvivalensben rákövetkező logikai tranzakció elkezdődik. 








Nem elosztott környezetben a kétfázisú zárolás elégséges feltétele volt a sorosít- 
hatóságnak. Elosztott környezetben ez nincs így. 


Példa, Két globális tranzakció egyenként két-két lokális tranzakcióból áll: 
n:-TutMaTsTatT2 
amelyek közül 711 és 731 valamint 712 és T2? azonos csornópontban fut. 





csomópont i csomópont 2 
WLOCK B 
UNLOCK A UNLOCK B 
WLOCK A WLOCK B 
UNLOCK A UNLOCK B 


A lokális sorosítási gráfok: 
Ti o7 T) -T 


A globális sorosítási gráf: 
nzT 
Azaz a sorosítási gráfban kör van, a globális ütemezés nem sorosítható, mégha a 
Jokális sorosíthatóság fenn is áll n lokális kétfázisúság következtében. 


11.2.1. Elosztott kétfázisú zárolás 


A globális sorosíthatósághoz nyilván elégséges feltétel, hogyha a globális tranzak- 
ciók globálisan kélfázisúnk, azaz egy T; tranzakció egyetlen Ti; lokális tranzakciója 
sem engedhet el egyetlen zárat sem, ameddig bármelyik Ti; még kérhet új zárat. 


A megvalósítás úgy képzelhető el, ha a lokális tranzakciók üzenetváltásokkal ín- 
formálják egymást arról, hogy elérték a zárpontjukat, több zárra nincs szükségük. 
Azaz kell egy közös zárpont. 


11.2.2. Szigorú kétfázisú zárolás 


A lavinák problémája az elosztott környezetben is megmaradt. Elkerülése ítt ís 
lehetséges, ha biztosítani tudjuk, hogy egyetlen lokális tranzakció se írjon az adat- 
bázisba mindaddig, amíg minden lokális tranzakció el nem érte a készpontját. A 
lavinák ellen tehát közös készpontot kell létrehozni, amihez az kell, hogy minden 
lokális tranzakció minden számítását befejezze, mindegyik zárját megkapja. Ha 
ez minden lokális tranzakcióra teljesül, akkor a tranzakció folytatható, egyébként 
pedig az összes lokális tranzakciónak abortálnia kell. Tehát a közös készpontot 
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megelőzi a közös zárpont elérése, vagy akár egybeeshet vele. In valmnely pro- 
tokoli tehát biztosítja a közös készpont képzését, akkor ez közös zárpontnak is 
megfelelő. A közös készpont megvalósítása különböző hibalehetőségeket Ís figye- 
lembe véve egy elosztott megegyezési feladatra vezet, amely költséges művelet. A 
következő szakasz részletesebben ismerteti, 


12.2.3. Elosztott készpont képzése 


Előként egy olyan (alap-)protokoll bemutatása következik, amely nem számol 
semmilyen hibával, tehát az üzenetek nem vesznek cl, a csomópontok nem csnek 
ki, A későbbiekben ezt a protokollt fogjuk tovább bővíteni, 


Feltételezések: 


Adott egy T logikai tranzakció, amely számos T; lokális tranzakcióból áll az A; 
csomópontokban, Koordinátornak ffőnöknek) nevezzük azt a csomópontot, ahol a 
tranzakciót kezdeményezték, a többi csomópont neve résztvevő, A protokoll célja, 
hogy közös döntésre jussanak a résztvevők, azaz vagy minden résztvevő abortálja 
a lokális tranzakcióját, vagy minden lokális tranzakció commitáljon. 


A résztvevők a lokális szavazatukat a koordinátornak egy üzenet formájában kül- 
dik el, amely ezekből a szavazatokból egy globális döntést hoz. A lokális szavazatok 
a következőképpen alakulnak: 


- a csomópont commitra szavaz akkor, ha a lokális tranzakció elérte a kész- 
pontját, 

- b csomópont abortra szavaz akkor, ha bármely ok miatt a lokális tranzakció 
abortálni kényszerült. 


A koordinátor czután két dolgot tehet: 


- Ia minden résztvevőtől , készre szavazok" üzenetet kapott, akkor ,commit" 
üzenetet küld minden résztvevőnek. Ez alapján a résztvevők egységesen tud- 
nak egy globális készpontot kialakítani, hiszen minden résztvevő értesül n 
többi résztvevő cornmít döntéséről. 

- Ha bárhonnan is ,abortra szavazók" üzenetet kop, akkor a tranzakciónak 
ís abortálnia kell, ezért sabort" üzenetet küld minden résztvevőnek, akik 
ennek hatására abortálják a lokális tranzakciókat. 


A protokoll segítségével Így egységes döntésre juthatnak a résztvevők. A csornó- 
pontok különböző állapotai és állapotátmenetei a következő ábrákon láthatóak. 
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nkészre ntomrit" 
szavazok" jött a koor- 


küldése dinátortól 
commitképes 















at 


kezdő állapot 


commit 











nabortra 
szavazok" 
" küldése 

nabort" jött a 
koordinátortól 


abort 
11.1. ábra. Egy résztvevő állapotai 


mindenki 
készre s, commit" 


szavazott küldése 


valaki abortra 


szavazot ves j 
abort kell esek 


11.2. ábra. A koordinátor állapotai 










kezdő állapot 





Megjegyzések. 


1. A koordinátor is résztvevő egyben, ő is küld magának üzeneteket, csak 
éppen ezek nem költséges üzenetek. 

2. Ha nem lenne koordinátor, csak résztvevők, akkor mindenki mindenkinek 
kellene, hogy küldjön üzenetet. Ilyenkor az üzenetek száma n2-tel lenne 
arányos. 

3. A most bemutatott protokoll nem kezeli a hibákat és könnyű azt is be- 
látni, hogy egy csomópont kícsése esetén a protokoll nem garantálja az 
egységes döntést. Ha például egy csomópont commitra szavazott, és nem 
kap üzenetet a koordinátortól, akkor nem léphet tovább, hiszen 


- commit állapotba nem léphet, mert jöhet ,abort" üzenet, 

- abort állapotba sem léphet, mert jöhet ,commit" üzenet. 
Ilyenkor a csomópont még a zárait sem engedheti el, ellenkező esetben 
sérülhet a globális kétfázisúság. 
A fent említett jelenség neve biokkolás, kiküszöbölése a gyakorlatban is 
használható protokollok egyik alapproblémája. 
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11.2.3.1. A kétfázisú kész protokoll (2PC protokoll) 


Az előző pontban bemutatott protokoll egy tövábbíejlesztett változnin a kétfázisú 
commit (two-pbase commit, 2PC) protokoll néven vált az iparban is elterjedtté, 
mert az alábbi hibalehetőségeket képes kezelni: 


- Elvesző üzenetek hálózati hiba miatt. 


- Kieső csomópont, amely később csetleg újraindulhat, de meghibásodása ese- 
tén hallgat, nem küld hamis üzenetét. 


Az alábbi hibák fellépésével ném kell számolnunk: 


- Üzenetek sorrendje felcserélődik, 
- Nem valós üzenetek generálódnak. 


A protokoll ezen felül feltételezi, hogy a csomópontok valamilyen stabil tárba ké- 
pcsek naplózni, amelyek a kiesések következtében nem vesznek el. Ez által garan- 
tálható, hogy a csomópont a kiesés utáni újrainduláskor ismeri az utolsó állapotát 
és képes helyreáltító lépéseket tenni. 


A hibamentes esethez képest a következő jelentősebb változtatások jelennek meg: 


1. A lokális tranzakciók mérik azt az időt, hogy mióta várják n választ a szava- 
zatukra. Ha túl sok idő telik el (timcout), akkor a rendszerben hiba történt, 
amelyet valamilyen módon kezelni kell. Ha ez a commitképces állapotban 
történne meg, akkor egy helyreállító állapotba kell átlépni. 

2. A koordinátor üzenetküldésse! szólítja fel a résztvevőket a szavazás megkez- 
désére. 

3. Ha egy résztvevő meghibásodik, és ezért ideiglenesen kícsik, akkor újraindu- 
lása során egy stabil tárba mentett naplóból képes emlékezni, hogy hozott-e 
már korábban döntést. Ia korábban abort vagy commit döntést hozott, 
akkor a megfelelő állapotba lép újraindulása után. Amennyiben még nem 
hozott döntést, akkor az 1. pontban említett helyreállító állapotba lép. 
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nkezdj nkészre commit" 
szavazni" szavazok" jött a koor- 
érkezik küldése dinátortól 










kezdő állapot 





nAbortra sza- 
vazok" küldése 


nsegítsetek" 
küldése 


blokkolt 


11.3. ábra. Egy résztvevő állapotai a 2PC protokollban 






timcout 


nkezdj mindenki 
szavazni" készre .Commit" 
küldése szavazott küldése 






sabort" 


timcout vagy küldése 


valaki abortra ; 
szavazott abort kell abort 


11.4. ábro. A koordinátor állapotai a 2?C protokollban 





A helyreállítás folyamata a következőképpen zajlik: 


- Ia a résztvevő belép a ,helyreállítás" állapotba, akkor , segítsetek" üzenetet 
küld az összes többi résztvevőnek (ehhez célszerűen ismernie keli őket). Erre 
az alábbi válaszok jöhetnek: 


9 Commit üzenet, mert ha a résztvevő már commit állapotban van, akkor 
ezt az üzenetet kell küldenie. 

0 Abort üzenet, abort állapotban lévő résztvevőtől vagy olyantól, aki még 
kezdő állapotban van. 


- Haarésztvevő commitképes állapotban van, akkor nem tud hasznos üzenetet 
küldeni, így nem ís küld semmit. Ennek oka az, hogy ebben az állapotban 
nem tudja, hogy más résztvevő szavazott-e már esetleg abortra. 

- A vsegítsetek" üzenetek elküldése után, a résztvevő várakozik a válaszra. 
Iyenkor a résztvevő blokkolt állapotban van, amelyből a beérkező üzenetek 
alapján helyes döntést fog hozni, hiszen: 


o nem kaphat commit és abort választ is a segítsetek" üzenetére, 
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o nem kaphat abortot, ha a koordinátor már globális commitot küldött, 
6 nem kaphat commitot, ha a koordinátor már globális abortot küldött. 


- Amennyiben nem jön semmilyen üzenet a segítségkérésre - mert pl. a többi 
résztvevő még commitképes állapotban van, vagy szintén segítségre várnak -, 
akkor a blokkolás a 2PC-nél ís bekövetkezhet. Ez például megtörténhet ak- 
kor, ha a koordinátor kicsik, közvetlen miután minden résztvevő commit 
szavazatot küldött (vagy ha minden a döntésről már értesült résztvevő is 
kicsik). 

- A koordinátor a várakozás állapotból timeouttal abort állapotba kerülhet, 
ha valamely résztvevő hosszú idő után sem válaszol. Ekkor ugyanis joggat 
feltételezhető, hogy a résztvevő nem elérhető vagy meghibásodott. Ilyenkor 
minden aktív résztvevő abort állapotba kerül. Amennyiben a meghibáso- 
dott résztvevő később újraindulna, akkor a többi, már abort döntést hozott 
résztvevőtől erről értesülni fog. 

- A résztvevő, ha hosszú idő után sem kap ,kezdj szavazni" üzenetet, akkor 
abort állapotba kerül, mert azt feltételezi, hogy a fönök elérhetetlenné vált 
vagy meghibásodott. Ebben az állapotában már elengedheti a zárait, ha 
pedig mégis megjön a ,kezdj szavazni" üzenet, akkor egyszerűen abortra 


szavaz. 








Megjegyzés. Egy lokális tranzakció kész vagy abortált állapotában is jöhetnek 
kérések, ha más lokális tranzakció segítséget kér, Ilyenkor a naptó alapján van 
lehetőség korrekt választ adni. 


Összefoglalva tehát a 2PC protokoll egyeg üzenetek elvesztését, egy csomópont 
ideiglenes kiesését, majd újraindulását képes helyesen kezelni, azonban blokko- 
lás mégis előfordulhat, így van létjogosultsága a következőkben bemutatott 3PC 
protokollnak. 


11.2.3.2. Egy , blokkolásmentes? kész protokoll — 3 fázisú kész 
protokoll (3PC) 


A háromfázisú commit (3PC) protokoll is csak bizonyos hibák esetén blokko- 
lásmentes. Valójában semmilyen protokoll nem képes minden hibára felkészülni, 
hiszen ha a kapcsolatok véglegesen megszakadnak, vagy hamis üzenetek jelennek 
meg a rendszerben, akkor a protokollok elvileg sem tudnak működni. A 2PC-nél 
a blokkolást az okozza, ha valamely résztvevő nem tudja, hogy mindenki készre 
szavazott, így előfordulhat, hogy minden résztvevő a készre szavaz, de ezt köve- 
tően a koordinátor kicsik. Így a működő résztvevők akár a commit állapotba is 
léphetnének, de ezt nem teszik meg - blokkolódik a rendszer. 


Ezért, a 3PC-nél commit állapotba csak akkor kerülhet egy résztvevő, hn már 
tudja, hogy mindenki tudja, hogy mindenki commitra szavazott. Mindez egy újabb 
üzenet-körrel realizálható (ez lesz a harmadik fázis), az ehhez tartozó újabb állapot 
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a ,commitra kész", Ennek a jelentése, hogy a rendszer globális commit döntést fog 
hozni, ha senki nem hibásodik meg. 


nkezdj nkészré 8 
szavazni" szavazok" nkészülj 
küldése commitra" jön 


















nabort" jött a timcout 


koordinátortól commit" 
jött a koor- 
dinátortól 


: terminálási protokoll ; - - - - - - - - "] commit 


11.5. ábra. Egy résztvevő fontosabb állapotai a $P?C protokollban 





nkczdj mindenki nkészülj 
szavazni" készre cormmitrn" 
küldése esz , küldése 
kezdő állapot várakozás [domniit kelt [commit kett!— commitrn kész 
34 
tüncout vagy sabort" commit 


valaki ükölten küldése küldése 


szavazott i Í HEZBEVE 
[dont kelt —— abort 1 [commie] 


11.6. ábra. A koordinátor állapotai a 3PC protokollban 





A három fázis értelmezése: 


- Az első fázis a 2PC-ből már ismert, szavazásra felszólítás, majd szavazás. 

- A második fázisban a koordinátor - amennyiben minden résztvevő commit 
szavazatot küldött - egy commitra készülj üzenetet küld a résztvevőknek, 
majd ezt követően nyugtára vár a résztvevőktől. Egy nyugta azt jelzi, hogy 
a résztvevő tudja, hogy mindenki commitra szavazott. Amennyiben minden 
résztvevő nyugtázta a commitra készülj üzeneteket, akkor a koordinátor ebből 
már megtudja, hogy már minden résztvevő tudja, hogy mindenki commitra 
szavazott, 

- Ezt követően a harmadik fázisban a koordinátor commit üzenetet küld a 
résztvevőknek, amiből már minden résztvevő ís megtudja, hogy mindenki 
tudja, hogy globális commit, lesz. 


A korábbi blokkolás megoldására egy ún. terminálási protokotit vezettek be a 
3PC-be, amely a hibakezelést valósítja meg. Amennyiben commitképes állapot- 
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ban vagy commitra kész állapotban tiímcout történik (azaz nem érkezik üzenet n 
koordinátortól), akkor a Itibakezelés az alábbi módon zajlik: 


1. A működő csomópontok egy új koordinátort választanak. 
2. Az új koordinátor bekéri a résztvevők aktuális állapotait. 
3. A beérkező információk alapján döntést hoz az új koordinátor (és ezt közli 
a résztvevőkkel): j 
a) Ha van abortált vagy még nem szavazott résztvevő, akkor globális abort 
döntés születik. 
b) Ha van comniitált résztvevő, akkor globális commit döntés születik. 


c) Ha mindenki commitképes állapotban van, akkor abort döntés fog szü- 
tetni. 


d) Ha van commitképes és commitra kész állapotú résztvevő ís, akkor 
a commitképeseknek commáítra készülj üzénetet kell küldeni, majd na 
nyugták után minden résztvevőnek commit üzenet kell küldeni. 





Megjegyzés. Belátható, hogy csak a fenti négy eset egyike történhet meg, nem 
érkezhetnek vegyesen abort és commit üzenetek. 





11.3. Elosztott időbélyeges tranzakciókezelés 


Az egyprocesszoros elvek jó része átvihető elosztott környezetre is, 


Ha egy tranzakció egy N csúcsban írja és/vagy olvassa az A adategységnek vala- 
mely A; példányát, akkor rajta hagyja az alkalmazott modellnek megfelelő időbé- 
lyegét. (Írás esetén természetesen minden példányt írni kell és a végleges adatbá- 
zisba írás előtt egy elosztott megegyezésnek kell lezajlanin.) A tranznkciónak az 
időbélyeget természetesen az a csomópont adja, ahol a tranzakciót kezdeményez- 
ték. Az egyértelműség biztosítása ítt ís alapvető követelmény, ami sérülhet, ha a 
csomópontok saját óráik alapján állítják elő az időbélyegeket. Egy megoldás: a 
helyi időből képzett időbélyeghez annak LSB részeként hozzáfüzzük na csomópont 
azonosítóját. 


Ezután annak ellenőrzése, hogy a kezdeményezett adat-hozzáférési műveletek össz- 
hangban vannak-e az időbélyegek növekvő sorrendje szerinti soros ekvivalenssel 
hasonló módon történhet, mint égyprocésszoros csetben. Majdnem minden elősz- 
tott zár alapú tranzakciókezelési módszernek megvan az elosztott időtélyeges meg- 
felelője. A WALL-lal analóg protokoll szerint pl. READ A csetén egyetlen R(A;), 
W(A;) vizsgálatából, míg WRITE A esetén az összes R(A;), W(A,) vizsgálatából 
döntendő el, hogy a tervezett adatelérés legális-e. 


Egy másik problémát jelenthet a különböző csomópontok óráinak eltérése. Az órák 
egzakt szinkronizmusa fizikai okok miatt nem tételezhető fel, de szerencsére nincs 
is rá szükség. 
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T. f. h. az W csomópont órája jelentős (több óra, vagy akár több nap) késést 
mutat a többi órához képest. Minden itt kezdeményezett tranzakció ezt a nagyon 
régi időbélyeget kapja meg. Ha valamely adategységhez hozzá akar férni, amelyet 
más csomópontokban kezdeményezett tranzakciók ís használnak, akkor nagy a 
valószínűsége, hogy sz tdategységnek az időbélyegei fiatalabbak, Ez gyakorlatilag 
azt jelenti, hogy a tranzakció abortra kényszerül, 


Ellenkezőleg, ha valamely csomópont órája jóval előbbre jár, mint a többié, akkor 
az itt kezdeményezett tranzakciók gyakorlatilag sohasem fognak sorosítási feltétel 
megsértése miatt abortálni. 


Kis óraeltérések esetének vizsgálatához arra gondoljunk, hogy az időbélyeges 
tranzakciókezelés azt utánozza, mintha a tranzakciók az időbélyegük áltai megha. 
tározott időpillanatban zérus idő alatt futnának le. Tehát a kis óraeltérések nem 
kritikusak, azonban késő óra esetén csökken, sictő óra esetén pedig nő a tranzakció 
sikeres lefutásánnk valószínűsége. 


A nngy óraeltérések könnyen korrigálhatók, hú na csornópontok egymáshoz küldött 
üzeneteihez hozzáillesztjük n küldő csomópont órájának pillanatnyi értékét is. Ha 
egy csomópont azt tapasztalja, hogy a jövőből kap üzenetet, akkor a saját órá- 
ját ehhez igazítja. Ha tehát egy csúcs - pl. meghibásodás miatt — leáll az órájával 
együtt, akkor újraindulás után szinte biztos, hogy az általa kezdeményezett tranz- 
akció nbortálni fog. A közben folyó üzenetváltások során azonban korrigálhatja 
az óráját, aminek hatására az újból elindított tranzakció a második kísérletre már 
átlagos valószínűséggel sikeres lesz. 


11.4. Csúcsok helyreállítása rendszerhibák után 


Ha egy elosztott adatbázisban valamely csomópont meghibásodik, ez nem oköz- 
hatja a teljes adatbázis kicsését. Egy csomópont hibája viszont könnyen eredmé. 
nyezheti azt, hogy bizonyos adategységek elérhetetlenné válnak. A korábbiakban 
megismertek szerint egy tranzakció csak akkor hajthat végre az adatbázison sikc- 
rcsen módosításokat, ha a módosítandó adategységnek mindegyik lokális példánya 
elérhető. Emintt mindazon tranzakciók sikertelenek lesznek, amelyek olyan adat- 
egységekre hivatkoznak, amelyeknek a kiesett csomópontban ís van példánya. Ez 
- szerencsétlen esetben - akár az adatbázis teljes elérhetetlenségét is okozhatja. 
Elkerülendő ezt a helyzetet biztosítani kelt, hogy az adatbázis - akár csökkent 
funkcionalitással, de - tovább működjön. 


A naplózás ebben az esetben minden csornópontnál szükséges. Ha a hálózati hibák 
ellen ís akarunk vele védekezni, akkor a csomópont által küldött és vett üzeneteket 
is naplózni kell. 


Amikor egy csomópont , feléled", akkor gondoskodnia kel! arról, hogy a lokális 
adatait konzisztens állapotba hozza a többi csomópontéval, 


Ehhez minden csomópont, amely észleli, hogy egy csomópont (pl. W) kiesett, 
naplózza ezt a tényt saját magánál, majd folytatja a működését, amennyiben ez 
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lehetséges, Amint az N csomópont feléledt, minden csomópontnak üzenetet küld. 
Ezt az üzenetet véve a többiek a naplójuk alapján - a korábban megismertekhez 
hasonló módon - kiderítik, hogy mely adategységek változtak meg nzok közül, 
amelyeknek N-ben ís van példányuk. Ezután ezeket az adatoknot elküldik W-nek, 
aki így a lokális adatait fel tudja frissíteni (eközben természetesen az érintett 
adategységekre zárakat kell helyezni). 


11.5. Elosztott pattok keletkezése és kezelése 


Patthelyzetek természetesen elosztott környezetben ís előfordulhatnak. A ke- 
letkezésük analóg az elosztott tranzakciók sorosíthatóságánnk alakulásával 
(Id.a II.2. szakasz ütemezését): 


k. előfordulhat, hogy valamely csomópontban alakul ki patthelyzet, a lokális 
tranzakciók között, ill. 

2. előfordulhat, hogy bár lokálisan sehol sincs patt, mégis a tranzakciók egy- 
mást várakoztatják. 


Az első esetben a lokális várakozási gráf nem DAG, a második csetben pedig a 
globális várakozási gráf nem DAG. 


Ebből viszont az is következik, hogy a globális várakozási gráf vizsgálata nem 
képzelhető el anélkül, hogy a csomópontok ne küldenének üzeneteket egymásnak 
arról, hogy a lokális várakoztatási viszonyok hogyan alakulnak. Bár a módszer mő- 
ködőképes - különösen, ha egy centrális csomópont foglalkozik a pattdetekcióval -, 
mégis hatékonyabb lehet számos esetben, ha a pattok létrejöttét akadályozzuk 
meg. 


Láttuk, hogy a patt elkerülhető egyproccsszoros környezetben, ha minden tranz- 
akció zárakat csak az adategységek növekvő sorrendjében kér. 


Ha zárkérésre a centrális csúcs módszert alkalmazzuk, és a másolatokat ís egyedi 
adategységeknek tekintjük, akkor az változtatás nélkül működőképes, és elkerül- 
hetők a pattok. 


Ha viszont a ,k az n-ből?" módszert használjuk, akkor be kell tartani az alábbi 
szabályokat: 


1. ha A c B, akkor LOCK A; minden i-re meg kell, hogy előzze bármely LOCK 
B;-t, 

2. az adategységek másolatait is sorrendbe kel) állítani, és a zárkérések csak a 
másolatok növekvő sorrendjében teljesíthetők. 


Nyilvánvaló akadálya az alkalmazásának, hogy előre kellene ismerni az adotogy- 
ségeket, amelyeken a tranzakció zárat akar elhelyezni, Ellenkező csetben szükség- 
telenül sok zárkérést kell menedzselni. 
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11.66. A fejezet új fogalmai 


elosztott adotbázis, ill. adatbázis-kezelő, lokális vagy fizikai adat, globális vagy 
logikai adat, globális vagy logikai tranzakció, lokális vagy fizikai (rész-) tranzak- 
ció, globális zár, lokális zár, adatüzenet, kontrollűzenet, globális zárkompatibiki. 
tási mátrix, elsődleges adatpéldány, centrális csúcs, olvasási token, írási token, 
elosztott sorosíthatóság, elosztott 2PL, glcbális zárpont, globális készpont, 2PC 
protokoll, hiokkolás, 3$PC protokol), elosztott időbélyeg, elosztott patthelyzet 
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12. fejezet 


Gyakorló feladatok 


A példatár után a feladatok mintegy feléhez található megoldás, A megoldások 
szándékosan elkülönülnek a feladatok szövegétől, mert a példatár javasolt és kí- 
vánatos felhasználása a feladatok megoldásainak önálló megkercsése, majd csak 
ezután a közölt megoldás tanulmányozása. 


Egyes feladatokhoz részletes megoldási útmutatót is adunk, másoknál csak vég- 
eredményt. Jelmagyarázat: o részletes megoldás, 0 csak végeredmény, O nem 
adtunk meg megoldást. 


12.1. ER-diagramok 


1. Adott a következő inforrnális leírás: 
Egy páciensnek számos betegsége is lehet, vannak betegségek, nmikben pil- 
lanatnyilag senki sem szenved. Minden pácicnst egyetlen mentőállomáson 
kezelnek, akár több orvos is. Az orvosoknak több páciensük is lehet, akik 
különböző mentőáltormásokon is fekhetnek. Egy mentőállomás lehet akár 
üres ís, és mindig pontosan egy kórházhoz tartozik. Egy kórháznak csetleg 
több mentőállomása és több orvosa ís van. Égy orvost legfeljebb 3 kórház al- 
kalmaz. A kórházat mindig egy olyan igazgató vezeti, aki a kórház orvosa ís, 
közgazdászdiplomával is rendelkezik és más kórházzal nincs munkaviszonya. 
Készítsen a fentiekről egyed-kapcsolati (ER) diagramot! A tanult szintak- 
tikával tüntesse fel pontosan a kapcsolatok funkcionalitását is! Azonosítsa 
az egyedeket célszerűen megválasztott attribútumokkal, határozza meg a 
kulcsokat! o 

2. Egy menza havi menüjt szeretnénk tárolni egy adatbázisban. A menü min- 
den nap egy levest, egy főételt és egy édességet tartalmaz. Egy étel többször 
is előfordulhat az adott hónapban, de tudjuk, hogy egy adott leves-főétel 
kombinációhoz csak egy édesség illik. Minden ételnek tárolni szeretnénk a 
nevét, az energiatartalmát, és hogy melyik hozzávalóból mennyi kell az el- 
készítéséhez. Készítsen ER-diagramot az adatbázishoz! O 

3. Adott a következő informális leírás: 
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Egy kórház számos osztályból áll, mindegyiknek van egy osztályvezető főor- 
vosn és akárhány főorvosa. Ha nincs osztályvezető főorvos, akkor van megbií. 
zott osztályvezető, Ők valamennyien a kórház - orvosdiptomával ís rendel- 
kező - alkalmazottai, másik kórházban nincs állásuk. Egy kórháznak ezen 
kívül még számos más dolgozója ís van: orvosok, nővérek, segédszemély- 
zet. Az orvosok és a nővérek mindig egy meghatározott osztályon dolgoz- 
nak, míg a segédszemélyzet közvetlenül a kórházhoz is tartozhat. Minden 
alkalmazottnak van kódszáma, de az orvosoknak nyilvántartják a kamarai 
tagsági számukat is. A kórházat mindig egy olyan igazgató vezeti, aki a kór- 
ház orvosa is, közgazdászdiplomával is rendelkezik és más kórházzal nincs 
. munkaviszonya. Egy beteg - ha bekerül a kórházba -— számos osztályt is 

megjárhat, amíg meggyógyul, és eközben számos betegséggel kezelhetik. 
Készítsen a fentiekről egyed-kapcsolati (ER) diagramot! A tanult színtak- 
tikával tüntesse fel pontosan a kapcsolatok funkcionalitását is! Azonosítsa 
az egyedeket célszerűen megválasztott attribútumokkal, aláhúzással jelölje 
meg a kulcsokat! o 

4. Hogyan alakítható át egy ternáris kapcsolatot tartalmazó ER-diagram ek- 
vávalensen csak bináris kapcsolatokat tartalmazó ER-diagrammá? 9 


12.2. Relációs sémaábrázolás, relációs algebra 


5. Alaokítsa át az alábbi ER-diagramot relációs sémákba! Törekedjen minél ke- 
vesebb séma kialakítására! O 





6. A feladat során az 1., ill. a 3. feladatban kapott ER-diagramokon dolgozzon. 
a) A diagramokat alakítsa át relációs sénákká! 

b) Végezze úgy az átalakítást, hogy a kapcsolatok megvalósításához a le- 
hető legkevesebb relációs sémát definiálja! 6 

7. Adott két relációs sérna R(A, B) és 5(B,C) valamint két reláció r(R) és 

s(5). Tudjuk, hogy r és s egyesítésével kapott relációnak (f,c) és (d.e) is 
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10. 


11. 


elemei. Tudjuk továbbá, hogy a természetes illesztésükket kapott relációnak 
pedig elemei az alábbiak is: 


B 


malo fm 
calolo 


Határozza meg a két relációt! 0 


, Adott egy r és egy s reláció, melyek rendre az R(A, B) illetve az S(B,C) 


sémára illeszkednek. r-nek van np csupa különböző sora, s-nek pcdig ne. 
Legfeljebb és legalább hány sora lehet (ny és ns függvényében) az r és s 
természetes illesztésének, ha 

a) A kulcs R-ben, 

t) B kulcs R-ben, 

c) B kulcs f-ben és §-ben is, 

d) A kulcs R-ben, B kulcs S-ben. o 


. Ha egy A attribútum kardinalitása kisebb, mint az A doménje elemeinek 


száma, akkor A nem lehet (egyszerű) kulcs. Igazolja vagy cáfolja az állítást! 
o 
Legyen r, s két azonos attribútumokkal rendelkező reláció, X pedig ezen 
közös attribútumhalmaz egy részhalmaza. Melyek igazak az alábbi állítások 
közül? 
a) nyír 5) — mxír) Unx(5) 
0) mx(rNs)-axtr)Vrxts) o 
Adott a következő sémalcírás, adjon relációs algebrai kifejezéseket a kérdé. 
sekre! 
- TERMÉK(GYÁRTÓ, MODELL, TÍPUS) (az összes attribútum együtt 
alkotja a kulcsot) 
- öszes CPU SEBESSÉG, MEMÓRIA, MEREVLEMEZ, CD, 
Rn) 
- LAPTOP( MODELL, CPU SEBESSÉG, MEMÓRIA, 
MEREVLEMEZ, KÉPERNYŐ, ÁR) 
- NYOMTATÓ(MODELL, SZÍNES, TÍPUS, ÁR) 
A CPU SEBESSÉG mértékegysége MHz, a MEMÓRIA és a MEREVLE- 
MEZ attribútumoké GB. 
Kérdések: 
a) Melyek azok a PC modellek, amelyeknek sebessége legalább 2 GHz? 
4) Mely gyártók készítenek legalább 1000 gigabájtos merevlemezű lapto- 
pot? 
c) Adjuk meg a ,B" gyártó által gyártott összes termék modellszámát és 
árát típustól függetlenül! 
d) Melyek azok a gyártók, akik laptopot gyártanak, de PC-t nem? 
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c) Melyek azok a gyártók, umelyek gyártanak legalább két, egymástól 
különböző, legalább 3 GHz-en működő PC-t vagy laptopot? (Nincs két 
azonos moódellszám!) 

f) Adjuk meg az összes 3 GHz-nél gyorsabb PC és laptop gyártóját! 

9) Adjuk meg azon gyártókat, amelyek olyan faptopokat hoznak forga- 
lomba, melyekkel megegyező tulajdonságú PC-ket ís árulnak! 0 

12, Tekintsük az alábbi csillagílotta adatbázissémát: 

- CSILLAGHAJÓLHAJÓNÉV. ÉV, FAJ) 

- DOLGOZÓ(DOLGOZÓNÉV, AZONOSÍTÓ, SZÜLETÉSI 

- BEOSZTÁS AZONOSÍTÓ, HAJÓNÉV, RANG) 

Az egyes attribútumok jelentései rendre a következők: 

- CSILLAGHAJÓ. a hajó neve, gyártási éve, és az hogy melyik faj tervei 
alapján készült 

- DOLGOZÓ: a dolgozó neve, Csillagílotta-azonosítója, mikor született 

- BEOSZTÁS: melyik dolgozó, melyik hajón, milyen rendfokozatban dol- 
gozik 

Adjunk relációs algebrni kifejezést, nmely megadja azon dolgozók nevét, akik 
Catherine Inneway kapitány hajóján dolgoznak! O 
13. Tekintsük n következő nlaprelációkat (n kézenlekvő értelmezéssel): 

- KEDVELSZEMÉLY, SÖR) 

- KAPHATÓ(SÖRÖZŐ, SÖR) 

- LÁTOGATISZEMÉLY, SÖRÖZŐ) 

Fejezze ki retíciós algebra segítségével 

a) azon sörök összességét, amelyeket minden látogató kedvel azokban a 

sörözőkben, ahol kaphatók! 


4) nzon személyek összességét, akik minden sört kedvelnek azokban a $5- 
rözökben, amelyeket látogatnak! o 


12.3. Hálós sémaábrázolás 


14. Adott egy ternáris kapcsolat az attribútumaival, Milyen mezőket tartal- 
mazínak) az ekvivalens hálós modellben a member típusú rekordíok)? o 

15. Bizonyítsa be, hogy a hálós modell esetén egy set típuson belül az owner 
példányokhoz kapcsolódó memberek halmazai diszjunktak. O 

16. Alakítsa át az alábbi ER-diagramot hálós sémába úgy, hogy minírnális számú 
set típust definiáljon! Definiálja a rekord típusokat is, a definíciókat rendezze 
ábécé sorrendbe! 6 
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17. Alakítson ki egy hálós sémát, amely személyeket, munkabelyeiket és mun- 
káikat leíró (egyszerűsített) adatbázis alapjául szolgálhat, Az alábbiakat 
szeretnénk ábrázolni: 

- Személy: név, személyi szám, lakcím, munkabelyíek), beosztásíok), 
projektek, amiken dolgozik. 

a Eszköz: megnevezés, azonosító, tulajdonos cég, a projektíek) amiben 
használják. 

- Cég: név, cím, vezető, dolgozók, projektek. 

- Projekt: elnevezés, vezető, érintett cégíek), határidő, résztvevők, O 


18. Adott az alábbi ER-diagram. 





a) Alakítsa át a diagramot hálós sémákba úgy, hogy a lehető legkevesebb 
set típust definiálja! A hálós séma elemeit a megfelelő ER-diagrambeli 
elemmel azonosan nevezze el! Rajzolja le a hálós sémát a tanult jelö- 
lésrendszert használva! Definiálja a rekordtípusok szerkezetét ís! 
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6) Alakítsa át a diagramot relációs sémákba úgy, hogy a lehető legke 
vesebb relációs sémát definiálja! A relációs séma elemeit a megfelelő 
ER-diagrambeli elemmel azonosan nevezze el! O 


19. Mindenki tudja, hogy a Nyuszi létezik, de azt már kevesen, hogy sok-sok 
hűsvéti nyuszi van! Minden bizonnyal a Húsvétinyuszi Zrt, ís rendelkezik 
adatbázissal az alkalmazottairót. A cégnek vannak kirendeltségei a konti- 
nenseken, egy kontinensen akár több is. Minden kirendeltség élén egy fő 
nyuszi áll, de egy nyuszi állhat akár több kirendeltség élén is, Azt tudjuk, 
hogy a vezérigazgató, Tapsi Hapsi, a húsvét-szigeteki kirendeltség vezetője. 
Minden nyuszi be van sorolva egy kírendeltséghez, ahol dolgozik és készíti 
az színes tojásokat. A Nyusziadatbázis tartalmazza minden gyerekről, hogy 
melyik nyuszi fetelős az ő tojásainak kézbesítéséért. Ez csak olyan nyuszi le- 
het, aki abban a körzetben dolgozik, ahol a kisgyerek lakik. A Húsvétinyuszi 
Zrt.re ís hat az információs társadalom, így szabványba foglalták, hogy a 
gyerekek jósága 1... 10-cs skálán mérhető és minden jóság mértékhez meg- 
adták a standard ajándéktojások mennyiségét is. Minden nyuszi licensszel 
rendelkezik adott jóságú gyerekeknek tojást vinni, de persze egy nyuszinak 
lehet több licensze is, 

A leírás alapján tervezzen a Nyuszindatbázishoz 
- ER-diagramot, 
- relációs sémát, 
- hálós sémát, 
Adjon relációs algebrai kifejezést a következő meghatározásához; Tapsi Hap- 


si saját maga szeretné megajándékozni a 10-cs faktorú gyerekeket, és kíván- 
csi, hogy melyik körzetben laknak. o 


12.4. Relációs lekérdező nyelvek 


20. A következő ER-diagramhoz illeszkedő relációs sémát definiáljon SOL-ben. 
(Hozzon létre megfelelő táblákat SOL utasításokkal.) Ne feledkezzen meg a 
különféle kényszerfeltételekről sem! O 
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21. 


22. 


23. 


24. 


25. 


26. 


A 
mi ree 1 kege Cresst 
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Adott a következő séma: JEGYEK(NEPTUN, DIÁKNÉV, TÁRGYKÓD, 
JEGY). (Melyik diák melyik tárgyból milyen jegyet kapott, a séma kulcsa 
a NEPTUN és a TÁRGYKÓD együtt.) 

a) Fejezze ki sorkalkulussal azokat a tárgykódokat, amely tárgyakból csak 
olyan diákok szereztek jegyet, akik legalább egy tárgyból szereztek teg- 
alább elégségest. 

b) Adjon SOL-lekérdezést, ami kilistázza azokat a tárgykódokat, amely 
tárgyakból csak olyan diákok szereztek jegyet, akiknek az (összes szer- 
zett jegyük) átlaga nagyobb, mint 4. 6 

Legyenek R(A, B,C, D) és S(C, D, E) sémák és legyenek ra c(op-2(r hi 5)), 
illetve rep(ír) n mop(s) rájuk illeszkedő relációk. Fejezze ki cz utóbbiakat 
sorkalkulussal, oszlopkalkulussal! o 

FASKÁNTE meg, hogy biztonságos-e az alábbi sorkalkulus kifejezés, ha 
almal) — (2,3]). o 


(20 (360) 20 (1) z ADD A ÚD[1] 5 2A ALMA) (20) j 


Az R séma attribútumai (A, B,C,D,E), az S séma attribútumai pcdig 
(A, B, F,G). Fejezze ki oszlopkalkulus segítségével r 24 s-et! O 

Az r reláció attribútumai (A, B,C, D), az s-é pedig (C, D). Ekkor ra, r 
és s hányadosa azon (A, B) attribútumú t sorokból áli, melyekre igaz, hogy 
bármely s-beli u sor esetén a fu sor (a t és u összefűzésével kapott sor) T- 
ben van. Fejezze ki r s-t sorkalkulus segítségével! Feltehetjük, hogy 93 nem 
űres.0 

Adott az alábbi relációs adatbázis: GYÁRT(CÉG, TÍPUS, ÁR), 
SZERETKVEVŐ, TÍPUS), 
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DOLGOZIK(VEVŐ, CÉG, BEOSZTÁS). 

A relációk jelentése rendre: azon nutótípusok, amiket egy cég gyárt, az azok 
eladási áro; egy vevő melyik autótípust szereti; a vevő melyik cégnél dolgozik, 
milyen beosztásban. 

a) Adjon meg egy sorkalkulus kifejezést, amely azokat a vevőket tartalma- 
zó relációt állítja elő, akik olyan cégnél dolgoznak, amelyek gyártanak 
olyan autótípust, arnilyet a vevő szeret! 

b) Vizsgálja meg, hogy a fent leírt kifejezés biztonságos-e! O 


12.5. Objektumorientált adatmodell 


27. Az objektumorientált adatmodellnél megismert típuskonstruktorok segítsé- 
gével készítse el az egyszerűsített ,újság" típust! Tárolnunk keli az újság 
címét, a főszerkesztőt, a főszerkesztő-helyetteseket (sorrendhelyesen), a ki- 
adót, a rovatokot a rovatvezetőkkel és rovatújságírókkal. 0 


12.6. Fizikai szervezés 


28. Milyen módszerekkel támogatható a több kulcs szerinti keresés? O 

29. Egy 25000 rekordból álló állományt szeretnénk ritka index szervezéssel tá. 
rolni. A rekordhossz 850 bájt, egy blokk kapacitása (a fejrészt nem számítva) 
4000 bájt. A kulcs 50 bájtos, egy mutató tárolásához 18 bájt kell. 

a) Legalább hány blokkra van szükség a teljes struktúra tárolásához? 

4) Mennyi ideig tart legfeljebb egy rekord tartalmának kiolvasása, ha ez 
operatív tárban rendelkezésünkre álló szabad hely 6000 bájt? (Egy 
blokkművelet ideje 5 ms.) 

c) Segít-e a rekordhozzáférési ídő csökkentésében, ha 10-szer ennyi szo- 
bad mcimóriával gazdálkodhatunk? Mi a helyzet 100-szor ennyi szabad 
memória csetén? Hogyan célszerű a többletmemóriát felhasználni? Oo 

30. Egy 15525 rekordból álló állományt szeretnénk ritka index szervezéssel tá- 
rolni. A rekordhossz 850 bájt, egy blokk kapacitása (a fejrészt nem számítva) 
4000 bájt. A kulcs 50 bájtos, egy mutató tárolásához 18 bájt kell. 

a) Legalább hány blokkra van szükség? 

6) Mennyi ideig tart legfeljebb egy rekord tartalmának kiolvasása, ha az 
operatív tárban rendelkezésünkre álló szabad hely 5000 bájt? (Égy 
blokkművelet ideje 5 ms.) 

c) Segít-e a rekordhozzáférési idő csökkentésében, ha 10-szer ennyi sza- 
bad memóriával gazdálkodhatunk? Mi a helyzet 100-szor ennyi szabad 
memória esetén? Hogyan célszerű a többletmemóriát felhasználni? O 
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31. Egy állományt sűrű index, majd erre épített egyszintes ritka index segítsé- 


32. 


33. 


34. 


gével szeretnénk tárolni. Adjon értelmes alsó becslést a szükséges blokkok 
számára az alábbi feltételek mellett: 


- az állomány 3 - 109 rekordból áll, 
- egy rekord hossza 300 bájt, 

- egy blokk mérete 1000 bájt, 

- a kulcshossz 45 bájt, 

- egy mutató hossza 5 bájt. 0 


Egy 270 000 rekordból álló állományt akarunk tárolni. Két lehetőség közül 
választhatunk: vagy sűrü indexre épített egyszintes ritka indexet haszná: 
Junk, vagy 3 szintes rítka indexet. Melyik megoldást lehet kevesebb btokk 
felhasználásával megvalósítani, ha még azt is el szeretnénk érni, hogy sem 
az indexállományban, sem a főállományban ne legyenek 807-nál telítettebb 
blokkok? Tudjuk, hogy egy blokk mérete 1900 bájt, egy rekord hossza 300 
bájt, a küles hossza 35 bájt, a mutató hossza pedig 15 bájt. (Optimális tá- 
rolást feltételezünk, azaz azt, hogy az adatok a lehető legkevesebb blokkban 
helyezkednek el a fenti feltételek figyelembevétele mellett.) 0 

Egy adatbázisban egymilliárd rekordot akarunk tárolni. Egy rekord mérete 
100 bájt, a blokkméret 4000 bájt. Egy blokkművelet hossza 5 ms. Két kulcs 
van, mindkettő 10 bájtos. A mutatók 32 bitesek. Az egyszerüség kedvéért 
feltételezzük, hogy egyszerre csak egy blokk fér el a memóriában, valamint 
a rekordokat a lehető legkompaktabb formában tároljuk. 

a) Javasoljon tárolási módszert, ha mindkét kulcs szerint akarunk majd 
keresni úgy, hogy a keresés maximum 40 ms-t vegyen igénybe! A mód- 
szernek támogatnia kell az intervallumkerecsést is. Készítsen magyarázó 
ábrát! ú 

b) Egy konkrét keresés a rekordok várhatóan 899-at adja eredményül, Ad- 
jon minél hatékonyabb módszert a kercsésre! Oz 


Vödrös hash alkalmazása esetén mit szükséges módosítani az adattároló 
struktúrán annak érdekében, hogy az adatelérési idő megfeleződjön? o 


. Egy adatstruktúrában hash-alapú tárolást építünk ki egy CD-lemezeket tá- 


roló adatbázisban. Minden CD-ről nyilvántartjuk, hogy képeket, zenéket, 
videót vagy adatot tárol, mindezt egy karakter típusú mezőben: K, Z, V, A. 
Milyen hash-függvényt célszerű választani, ha ezen mezőre szeretnénk ala- 
pozni a hash alapú adattárolást? Mi a mező kardinalítása? Oo 


. Egy adatbázisban szeretnénk 1000000 rekordot tárolni vödrös hash szerve- 


zéssel. Egy rekord mérete 110 bájt, egy blokk 3000 bájt, egy kulcs 25 bájt, 
egy mutató pedíg 64 bit méretű. Egy blokk elérésének ideje 5 ms. A re- 
kordelérési idő max. 20 ms lehet. A vödörkatalógus befér a memóriába, a 
hash-függvény egyenletesen szór. 

a) Mennyi az átlagos rekordelérési idő? 

6) A vödörkatalógus hány bájtot foglal el a memóriában? 
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c) Mennyi többletmemóriára lenne szükség, hogy a rekordelérési idő a 
felére csökkenjen? 6 


12.7. Funkcionális függések 


37. Bizonyítsa be, hogy az alábbi három szabályból következnek Armstrong axi- 
ómái. (Azaz csak ezen három szabályt használva axiómaként levezethetők 
az Armstrong axiómák, mint tételek") 

Ha X,Y2,€ egy relációsérna attribútumhalmazai, akkor: 
B1. XaX 

B2. Ha X 5 YZés 23 C, akkor X — YZ2O. 

B3. Ha X - FZ, akkor X 56 Y.O 

33. Mutassa meg, hogy igaz a tranzitivítási nxióma! O 

39. Bizonyítsa be a bővítési axiómát! O 

40. Igaz-e, hogy a következő nxiómarendszer teljes, azaz levezethbető-e felhasz- 
nálásukkal minden logikai következmény? 

- Ha X CR akkor X — X. 
- HAXY GC Rés X 2 Y, akkor XWG YW igaz tetszőleges WV C Rt-re. 
- HaXYZOR X-GYésY OZ akkr X aZ O 

4I. Adjon egy R(A, B,C) sémára illeszkedő r relációt, melynek 4 sora van, és 
nem teljesül rá semmilyen nemtriviális funkcionális függés. 9 

42. Adott egy (R,F) séma, ahol R(A B CGWX,Y.Z2) és F -— 
(AZ a BGYZ. AY 5 06, CG WB- 6). Adja meg F-nek egy minimális 
fedését! Igaz-e, hogy AXZ 5 BYE FP? o 

43. Igozak-e az alábbi szabályok? (A, B,C, D tetszőleges attribútumhalmsazok 

egy ft sémán.) 

4) A B0 3 D s AU(CNB) - BD, 
9) Aa Bo D5 CUÍDYVA) - BD.0 
Adott egy RA, B, C) sémára illeszkedő r reláció, amelynek 3 sora van. Bizo- 


nyítsa be, hogy meg lehet adni olyan nemtriviálíis funkcionális függést, amit 
r kielégít! o 
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. 


12.8. Normálformák 


45. Mutassa meg, hogy egy 2NF sémára illeszkedő reláció lehet redundáns! Ma- 
gyarázza el, hogyan lehet megszüntetni! Adjon példát legalább 3-elemű, 2NF 
sémára illeszkedő relációra, mely nem redundáns! O 

46. Bizonyítsa be, hogy F és G függéshalmaz pontosan akkor ekvivalens, ha 
FEGtésGGFHO 

47. Hányadik legmagasabb normálformában van az f(A, B, C, D) relációs séma, 
ha F5- (CG B,.Bó D,AB— AC CD7 By? 6 
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a. sátánt öttesásááásárágátetler ene ré áá 


48. 


49. 


50. 


Vizsgálja meg, hogy bányadik legmagasabb normálformában van az 
RU,S,T,0) relációs séma az F - (173. 0,5T-6 0.155 T,05a HR füg- 
géshalmaz esetén! 0 

Bizonyítsa be, hogy ha az ff relációs séma nem BCNP, akkor 3A, B, hogy 
ABE Rés RYABG 4A!o 

Állapítsa meg, hogy tartalmazhat-e redundanciát (funkcionális függések kö- 
vetkeztében) az (f, F) sérmára illeszkedő reláció, és ha igen, akkor milyen 
jelegüt? R(X,Y, Z, WV), F s (XYa ZYZo WXa WWW WYoa X).O 


12.9. Relációs sémafelbontás 


51. 


52. 


53. 


59. 


56. 


97. 


58. 


Adott egy (Rt, F) séma, ahol R(A, B, C, D, E) és 
F:(AB6 CDO A, Aa B.CDa E, BE-G D. 

a) BCNF-ben van-e ez a séma? 

b) Ha igen, bizonyítsa be, ha nem, akkor adja meg a séma egy vesztéség- 

mentes felbontását BCNF sémákra! o 

Adott az RL, M,N,O, P) relációs séma és a séma attribútumain értelme- 
zett F z (MOPO L LN 5 ON NO - AM, OP a N.PN a LP) funkcioná- 
lis függéshalmaz. Az R séma egy veszteségmentes felbontását szeretnénk 
elkészíteni tetszőleges formában, de nemtríiviális módon úgy, hogy az egyik 
részséma R1(L, M, 0) legyen. 

a) Adjon meg egy ilyen felbontást! 

6) Van olyan megoldás, ami két részsémára bont? 0 
Adott az R(A BC.D,E,F) relációs séma és az F 5 
(A- B, 4AC—a DB. C5 AD, AF— ECB) függéshalmaz. Adja meg a 
séma egy veszteségmentes, függőségőrző felbontását 2NF sémákba, 
törekedve minél kevesebb relációs séma definiálására! 6 


. Adott az R(G, H, I, J, K, L) séma. Adjon egy veszteségmentes, függőségörző 


felbontást 3NF részsémákra, ha az ismert funkcionális függések halmaza 
F-(HJÓa J.GHoO I, HI— JG ,G 5 JO 

Vizsgálja meg, hogy lehet-e az 5S(L,M) relációs séma része az 
R(L,M,N,O) relációs séma valamely veszteségmentes felbontásának oz 
F5(MN- 0, N0— LN 6 MM —r NY függéshalmaz csetén! 0 

Adott a következő relációs séma: R(ABCDE F : 
(4850 AG E Bo D). Adja meg R egy veszteségmentes felbon- 
tását BCNF részsémákra! Oo 

Vizsgálja meg, hogy az R(A, BC, D,E,F,6) reláci- 
ós séma c m (ACEFG, BCDE) felbontása az F z 
1483 € 400 DC5GFD5-BEoG függéshalmaz mellett 
veszteségmentes-e! 0 

Tekintsük a következő (R,F) sémát, ahol R(A,B.CD,E) és F 5 
(BOE EGA AS DDa E]. 
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Igaz-e, hogy a P(AB, BOD, ADE) felbontás veszteségmentes? O 

59. Bizonyítsa be, hogy egy reláció tetszőleges vertikális felbontása után a rész- 
relációknak a térmészetes illesztésével sorok nem tünhetnek el, csak újak 
jelenhetnek meg! O 

60. Van egy relációs sémánk és annak egy nem függőségőrző felbontása, Ha a fel. 
bontásra illeszkedő egyik relációhoz hozzáadunk egy új elemet, melyen nem 
érvénycsülínek) az ,elveszett" függőségíek), akkor a relációba egy helytelen 
elem kerülhet. Ezután ha vesszük a felbontásban szereplő relációk természe- 
tes illesztését, akkor az eredeti relációnál bővebb relációt kapunk, tehát a 
nem függőségőrző felbontás nem veszteségmentes. Hol a hiba a gondolatme- 
netben? o 

61. Vizsgálja meg, hogy igaz-e a következő állítás: minden r(ft, F)-re mg (r) 4 
zx(r) b4 7pz(r) z r, ahol RA BC. D,E,G, H) relációs séma, ha 
F - (AB5 € 405 DCG HDO B.EG 6) függéshalmaz és g 5 
(RU(ACE), RA(EHG), ft3(BCDE)) egy sémafelbontás. O 


12.10. Tranzakciókezelés 


62. Tekintsük a Tj, 72, Ts. Ts tranzakciók alábbi ütemezését (az utasítások 
sorfolytonosan szerepelnek): 
- Tx: RLOCK A; 13: RLOCK A; T2: WLOCK B; 72: UNLOCK A; 
- Tz3: WLOCK A; T2: UNLOCK B; Ti: RLOCK B; T4: UNLOCK A; 
- Ta: RLOCK B; Ty: RLOCK A; T4: UNLOCK B; Ty: WLOCK C; 
- Ty: UNLOCK A; Ti: WLOCK A; Ty: UNLOCK A; Ti: UNLOCK B; 
- Ti: UNLOCK €. 
Rajzolja meg az ütemezés precedencia (sorosítási) gráfját, és döntse el, hogy 
az ütemezés sorosítható-e! 6 
63. Rajzolja fel a prcccdenciográfot! Használjon zárakat! Hogyan változik a gráf, 
ha kétfázisú a rendszer? o 


T) 





WRITE B 
WRITE 8 
WRITE A 


64. Mi történik a redo protokoll szerint, ha a tranzakció a bejelölt (1-6.) pon- 
tokban abortál? o 
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(1) 


2) 


(3) 
(4) 


(5) 


(6) 


naplóbaíT, BEGIN) 


LOGK(A) 
LOCK(B) 


naplóbaíT, (A értéke), (A új értéke)) 
naplóbalT, (5 értéke), (B új értéke) 


naplóbaíT, COMMIT) 


WRITEC4) 
WRITE(B) 


UNLOCK(A) 
ÜNLOCK(B) 


65. A következő tranzakció szígorú 2PL? Ha nem, módosítsa úgy, hogy az legyen! 
Mit biztosít ez a protokoll? 0 


LOCK A 
READ A 
AzZAx2 
WRITE A 
COMMIT 
UNLOCK A 


66. Miért lehet előnyös zárakat ís használni ídőbélyeges tranzakciókezelésnél? O 


67. Fakultatív feladat: Sorosítható-e az alábbi ütemezés időbélyeges (R/W) 
tranzakciókezelés használatával? o 


Tt T; 
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13. fejezet 


Gyakorló feladatok megoldásai 


13.1. ER-diagramok 
1. Az ER-dinagram: 





ZTTESZzr 
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Megjegyzések. 

1. A feladat nem specifikálta, hogy a mentőálloméások azonosító 
ja globálisan vagy csak kórházanként egyedi, A megoldásban a 
MENTŐÁLLOMÁS azért lett gyenge egyedhalmaz, mert Így garan- 
tálhatjuk, hogy egy mentőállomás pontosan egy kórházhoz tartozzon, 

2. A megoldás nem tudja ábrázolni azt, hogy a kórházigazgató a kórház 
egy dolgozója. Egy lehetséges megoldás: ahelyett, hogy az ORVOS 
egyedhalmazból származtatnánk kórházigazgatót és kezelőorvost, a 
DOLGOZIK kapcsolattípusból gyenge egyedhalmazt készítünk és ebből 
egy IGAZGATÓ - szintén gyenge - egyedhalmazt származtatunk, 
ami rendelkezik ,közg. diplsz" attribútummai. A megoldás hátránya, 
hogy nem köti meg a kórházigazgató egyediségét. 

3. A ternáris kapcsolattípusok kardinalitását nem definiáltuk, ezért a 
KEZEL kapcsolattípus nem tudja ábrázolni azt, hogy egy pácienst 
pontosan egy mentőállomáson kezelnek. 

4. Azt, hogy egy orvost legfeljebb 3 kórház alkalmaz, nem tudjuk ábrá- 
zolni a diagramon, ezt kiegészítésként mellékelnünk kell. Egy relációs 
adatmodollt használó adatbázisban a korlátozásokat elsősorban adat 
bázis kényszerek, másodsorban ún. triggerek alkalmazásával garan- 
tálhatjuk. Egy másik lehetséges megoldás 3 több-egy kardinalitású 
kapcsolattípus felvétele. 


KEZELŐORVOS 


Ez a módszer akkor használható jól, ha csak néhány kapcsolattípust 
kell felvenni. A módszer előnye, hogy a több-egy kapcsolatok keve- 
sebb sémára képezhetők le, ld. a 6 feladat megoldásában, 
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3. Az ER-diagram: 


OSZTÁLYI 
SEGÉDSZEM. 





A rövidített kapcsolattípusok jelentése: 
o DOLG 8: osztályon dolgozik, 
9 DOLG K: kórházban dolgozik, 
o VEZ ü. osztályt vezet, 
o VEZ K: kórházat vezet. 


A főorvosokat és a megbízott osztályvezetőket a rang attribútumrnal azono- 
sítjuk. 
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Az h. feladat megoldásához hasonlóan ez a megoldás sem tudja ábrázolni azt, 


hogy a kórházigazgató a kórház egy dolgozója. Áz ott vázolt megoldáshoz 
hasonló alkalmazható itt is. 


4. Egy ternáris kapcsolat: 





A ternáris kapcsolatot három bináris kapcsolatra transzformáljuk. Ehhez 
egy új, a kapcsolatot reprezentáló R egyedhalmazt veszünk fel. Annak érde 
kében, bogy ne három független bináris kapcsolatot kapjunk - amelyek nem 
(feltétlenül) ugyanazokat a példányokat kapcsolnák össze, mint amelyeket 
egy ternáris kapcsolatpéldány, ezért R olyan gyenge egyedhalmaz lesz, amcly- 
nek három determináló kapcsolata van, A kapcsolat attribútumai egyébként 
önmagukban nem ís feltétlenül biztosítanának egyediséget, de az E1, E2, E3 
egyedbalmazok kulcsaival együtt már igen. 





A ternáris kapcsolat kardinalitásának elemzése túlmutat a jegyzet keretein, 
ezért ezzel nem foglalkozunk. 


! A mélyebb részletek iránt is érdeklődök számára ld. pl. Trevor 1. Jones, [-Ycol Song, 
Binory Egtivatenis of Ternary ftelationships ín Entíty-Relattonship Modeting: a Logico! 
Decomposition Approach, Journal of Database Management, April-June, 2000, pp. 12-19, 
http://www.196bool.drexel.edu/faculty/song/publícatíonsZp. JDB99 . PDF, 
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13.2. Relációs sémaábrázolás, relációs algebra 
6. Azoknál a sémáknál, ahol nem egyértelmű, hogy mely attribútumok alkot- 
nak kulcsot, ill. idegen kulcsot, külön felsoroltuk a kulcs attribútumait. 
Azoknál a sémáknál, ahol minden attribútum idegen kulcs, az összes att. 
ribútum együtt alkotja a kulcsot. 
Ha a 5) feladatrészben nem soroljuk fel külön egy séma attribútumait, akkor 
azok megegyeznek az a) feladatrészben találhatókkal. 
1. feladat 
a) Az egyedhalmazoknak és az egy-egy kapcsolatoknak megfelelő sémák: 
o EMBERÍSszem szám,szül tely,szül idő, név) 
o ORVOS( szem. szám, szül hely szül idő, név, orvosi dípisz) 
o PÁCIENS(szem szám, szül hely szül idő, név, TAJ) 
o KÓRHÁZIG(szem szám, szül hely szül idő, név, orvosi dipisz, 
közg díplsz vezet kórháznév) 
o KEZELŐORVOSÍszem szám, szül hely,szül idő, név, 
orvosi dipisz) 
o KÓRHÁZ(név) 
o BETEGSÉG(kód, név) 
6 MENTŐÁLLOMÁS(áttomáskód, kórháznév, círn) 
A bináris több-több és a ternáris kapcsolattípusoknak megfelelő sémák: 
o SZENVEDÍSszem szám, betcasséa kód) 
o KEZEIL(oruos szem sz,páciens szem sz kórház név, állkód) 
o DOLGOZIKíszem szám, kórháznév) 
Az I. feladot megoldásának 4. megjegyzése - azt, hogy egy orvost leg- 
feljebb 3 kórház alkalmaz, nem tudjuk ábrázolni az ER-diagramon - a 
leképzés után is érvényes. Ha az ott javasoltaknnk megfelelően 3 több- 
egy kardínalítású kapcsolattípust veszünk fel, a DOLGOZIK séma he- 
lyett az alábbi sémákat kapjuk: 
o MUNKAHELYE tíszem szám, kérháznév) 
o MUNKAHELYE 2szem szám.kérháznév 
o MUNKÁHELYE S(íszem szám,kórháznév) 

6) Az egyedhalmazoknak és az egy-egy kapcsolattípusoknak megfelelő sé- 
mák: az EMBER sémát megszüntetjük (minden, a kórház adatbázisa 
szempontjából releváns ember orvos vagy páciens?). A kórház igazga- 
tójának személyi számát és közgazdászdiplomája számát a KÓRHÁZ 
sémában tároljuk (ez garantálja azt is, hogy egy kórháznak csak egy 
igazgatója lehessen). Így a KÓRHÁZIG séma feleslegessé válik. 

o PÁCIENS 
o ORVOS 
o KEZELŐORVOS 


2 Az EMBER séma az objektumorientált programozás terminológiája szerint absztrakt. 
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Lee en me 4f— ák mr te een — ir frissit Ma 7 


c KÓRHÁZÍnév, igazgató szem szám , igazgató közg dípiszáma) 
o BETEGSÉG 
o MENTŐÁLLOMÁS 
A bináris több-több és a ternáris kapcsolattípusoknak megfelelő sémák 
változatlanok: 
o SZENVED 
o KEZEL 
o DOLGOZIK 
Az 1. feladat megoldásának 4. megjegyzésében javasolt 3 kapcsolnit(- 
pust leképezhetjük a KEZELŐORVOS sémára is, ekkor az a) meg. 
oldásban szereplő MUNKAHELYE ! stb. sémákat kiválthatjuk a 
KEZELŐORVOS sémába felvett attribútumokkal: 
o KEZELŐORVOS(személyi szám,sz hely,sz idő, név, 
orvosi diplomaszám, munkahelye 1, munkahelye 2, 
munkahelye 3) 





Megjegyzés. Természetesen ekkor a DOLGOZIK sérára nincs szük- 


3. feladat 





a) Az egyedhalmazoknak és az egy-egy kapcsolattípusoknak megfelelő 
sémák; 


909000 


EMBERÍszem szám. név, szül hely, szül idő) 
SZEMÉLYZETE szem szám, név, szül hely, szül idő,kód) 
BETEG(szem szám,név,szül hely, szül idő, TAJ) 

OSZTÁLYI SZEMíszem szám, név,szül hely, szül idő, kód) 
KÓRHÁZI SEGÉDSZEMÍszem. szám, név, szül hely, 

szül idő,kód) 

ORVOSÍszem szám,névszül hely, szül idő, kód, 

orvosi diplsz, rang, kamarai t sz) 


o NŐVÉRIszem szám,név, szül hely,szül idő, kód) 
o OSZTÁLYI SEGÉDSZEMíszem szám, név, szül hely, 


o 


szül idő, kód) 

KÓRHÁZIGíszem szám, név, szül hely, szül idő, kód, 
orvosi diplsz,rang,kamarai tí sz,közg díplsz, 

vez k kórháznév) 


o BETEGSÉGÍkőd, név) 

o KÓRHÁZínév) 

o OSZTÁLY(osztálynév, kórháznév, vez o szem szám) 
A több-egy kapcsolattípusoknak megfelelő sémák: 


o 
o 


DOLG O(szem szám, kórháznév, osztálmév) 
DOLG Kíszem szám, kórháznév) 
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A ternáris kapcsolattípusnak megfelelő séma: 
o SZENVEDÍszem szám, kórháznév, osztálynév, betegségkőd) 


Megjegyzés. Az OSZTÁLY gyenge egyedhalmaz, ezért a 
TARTOZIK több-egy kapcsolattípust nem képezhetjük le külön sé- 
mára, mert az OSZTÁLY-nak nem lenne kulcsa. A DOLG 0. 
ban idegen kulcsként e az OSZTÁLY séma teljes kulcsát meg kell 
adnunk. 





b) Az egyedhalmazoknak és az egy-egy kájezajáttísssakásk meg- 
felelő sémák: a 2. feladat sérmáihoz hasonlóan itt is megszün- 
tethetjük az EMBER sémát és összevonhatjuk az orvosokat és 
a kórházigazgatót. Szintén megszüntethetjük a SZEMÉLYZET 
sémát. A több-egy kapcsolattípusoknak megfelelő DOLG 0 és 
DOLG K kapcsolattípusokhoz nem veszünk fel külön sémát. Előb- 
bihez az OSZTÁLY! SZEM sémába és leszármazottaiba, utóbbi. 
hoz a KÓRHÁZI SEGÉDSZEMN sémába vesszük fel a megfelelő 
idegen kulcsokat. 

o BETEG(...) 
o OSZTÁLYI SZEMÍszem szám,név,szül hely szül idő, kód, 
dola o kórháznév, dolg o osztálmév) 
o KÓRHÁZI SEGÉDSZEMíszem szám, név, szül hely, 
szül idő kód, dola k kórháznév) 
o ÖRVOSÍszem szám, név, szül hely szül idő, kód, 
orvost diplsz, rang kamarai t szodolag a kórháznén 
dola o osztálmév) 


o NŐVÉR(szem szá szám, név, szül hely szül idő, kód, 
dola o kórháznév, dolg o osztálynév) 
o OSZTÁLYI SEGÉDSZEM(szem szám, név, szül hely, 


szül idő kód, dol o kórháznév, dolg o  osztálunév) 
o BETEGSÉG...) 
o 


KÓRHÁZÁnév, inazgató szem száma, igazgató közg .diplszáma) 
o OSZTÁLM...) 
A ternáris kapcsolattípusnak megfelelő séma: 
o SZENVELM. ..) 
8. A természetes illesztésnek mindenhol legalább 0 sora lesz - akkor és csak 
akkor 0, ha ríf)-ben és s(5)-ben nincs azonos B attribútumérték. 
a) A kulcs R-ben. 
Legfeljebb nr - ns, ha r és s minden sorának B mezője megegyezik. 
6) B kulcs R-ben. 
Készítsük az illesztést úgy, hogy az s reláció soraihoz keresünk megfe- 
lelő sort az r-ben. Mivel 8 kulcs f-ben, r-nek a B attribútumon felvett 
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értékei egyediek. Ezért s soraihoz legfeljebb egy-egy illeszkedő sor ta- 
lálhatunk r-ben, vagyis legfeljebb ns sora lesz a kapott relációnak. 

c) B kulcs R-ben és §-ben is. 
Az illesztés menti attribútum kulcs, tehát relációnként minden sorban 
egyedi. Ezért az illesztés során legfeljebb annyi párt alkothatnak, ahány 
sora a kevesebb sorból álló relációnak van, tehát a kapott relációnak 
legfeljebb min (nr, ns) sora lesz. 

d) A kulcs R-ben, B kulcs S-ben. 
Az illesztéssel kapható sorok szempontjából nem releváns, hogy A 
kulcs-e. Így a megoldás a B kulcs A-ben eset tükörképe: legfeljebb 
ny sora lesz a kapott relációnak, 


11, A megoldás során a várt ereményt tartalmazó relációt r-rel jelöljük. 
a) Melyek azok a PC modellek, amelyeknek sebessége legalább 2 GHz? 


7 7 T MODELL (e cpu. segesséGs 2000 (Po) 


b) Mely gyártók készítenek legalább I000 gigabájtos merevlemezű lapto- 
pot? 


T z RGyARTÓ (OMEREVLEMEZ? 1009 (daptop) M termék) 


e) Adjuk meg a B gyártó által gyártott összes termék modellszámát és 
árát típustól függetlenül! 


T E OGYÁRTÓ- BÁTGYÁRTÓ MODELL ÁR (termék 4 pc) U 
TGYÁRTÓ MODELL ÁR termék X laptopj u 
TGYÁRTÓ MODELL ÁR (termék M nyomtató) ) 
d) Melyek azok a gyártók, akik laptopot gyártanak, de PC-t nem? 
tgyARró (termék 4 laptop) Mzgyánró (termék M pc) 


e) Melyek azok a gyártók, amelyek gyártanak legalább két, egymástól 
különböző, legalább 3 GHz-en működő PC-t vagy laptopot? (Nincs két 
azonos módellszám!) 


s -9CPU SEB3 3000 ÍT MODELL,.CPU. SEB (PO) U mropeLt,CPV. ses (laptop)) 
W termék 
t—rGgyARTÓ MODELL (5) 


TERGYÁRTÓ (z MGYÁRTÓIZGYÁRTÓZAMODELL tá MODELL? ) 
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13. 


1) Az összes 3 GH2-nél gyorsabb PC és laptop gyártója. 


s Z9CPW. SEB3 3000 (TMODELL.SEB (PC) U TtopELt, seg (laptop) ) MW termék 
rszgyáRról5) 

9) Azon gyártók, melyek olyan laptopokat hoznak forgalomba, melyekkel 
megegyező tulajdonságú PC-ket is árulnak. 
IZtGYÁRTÓ,CPU SEBESSÉG MEMÓRIA MEREVLEMEZ (faptop ti termék) 
P ERGYÁRTÓ CPU. SEBESSÉG MEMÓRIA MEREVLEMEZ (PC VA termék) 
r emgGyll MiGy-p.GYALSEB-p.SEBALMEN zs. MEMALML-p ML P) 


a) msör(kopható) N Tsör (T személy sőr (kapható b4 látogat) N kedvel) 
6) A feladat megoldása nagyon hasonlít az a) feladat megoldására. 


13.3. Hálós sémaábrázolás 


14. 


Egy ternáris kapcsolat ER-diagramon ábrázolva: 





A hálós modell közvetlenül csak bináris több-egy kapcsolatokat képes imp- 
lementálni, ezért minden mást kapcsolattípust ilyenekre kell visszavezetni, 
Ennek érdekében fel kell vennünk egy új virtuális rekord típust, amely tartal- 
mazza a kapcsolat attribútumait és membere lesz mindhárom set típusnak. 
Ezzel a módszerrel minden R példányhoz egyértelműen tudunk egy-egy Ei, 
E2, E3-beli példányt rendelni, hiszen egy set típuson belül a member rekor- 
dok egyértelműen azonosítják a hozzájuk tartozó owner rekordot. 
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Az ft rekord típusban szerepelnek az Al, A2, . . . , An attribútutnoknak neg: 
felelő mezők. 
16. A hálós modellt: 





Az egyes rekord típusokban az alábbi mezők szerepelnek (a sctek kialakítá- 
sához szükséges mutatókon kívüly: 
o A(ALA2 49) 
o B(B1, B2) 
o C(€1, C2) 
a DD, D2, D3) 
9 T() 
19. ER-diagram: 





Az ER-diagram eszközeivel nem ábrázolhatók az alábbi megkötések: 
o a jóság értéke 1. . . 10 közötti egész szám lehet. 
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o egy nyuszi csak olyan gyerekért lehet felelős, aki olyan körzetben lakik, 
ami ahhoz a körzethez tartozik, ahol a nyuszi dolgozik 
Relációs sémák: 
JÓSÁG színt, tojásszán) 
KIRENDELTSÉGT id kör: név, vezető név) 
NYUSZÍ( név, kirendeltség  íd) 
KÖRZET körz név, kontinens) 
GYEREK(szem szám, név, jóság szint,kőörz név) 


o 


96 0900£0 


FELELŐSÍ nyuszi név, nyerek szem szám) 
o LICENSZÍjósán szint, nyuszi név) 
Hálós sémák; 


UCENSZJÓSÁG 





Tapsi Iiapsi saját maga szeretné megajándékozni a 10-cs faktorú gyerekeket, 
és kíváncsi, hogy melyik körzetben laknak; 


. "néwkörzet név (jós g.szríntz JÓ (gyerek )) 


13.4. Relációs lekérdező nyelvek 
21. a) Olyan u() sorok Tárgykódját keressük ((1) — u[3]), amelyeknél min. 
den, a tárgyat felvett (u[3] — sí31) hallgatónak van legalább egy elég- 
séges osztályzata (p[4] 2 2). 
(0 (39) JEGYEK(u) At] — utg]a 
( (vs(? ) (JEGYEK(5) A ul3] — s[3]) — 
(300) JEGYEK(p) A s(1) — oli ata 2 2) )) 


Az implikációt átírva és átalakítva az egyik De Morgan azonossággal: 
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(24D] (30) JEGYEK(u) A tl1) — ul8]a 
( (vs(9) -JEGYEK(s) v ul3] £ sl8]v 
( (309) JEGYEK() Ash — pl] an) 2 2) )) 
b) A lekérdezés: I I 


SELECT Tárgykód 
FROHK 

Jegyek, 

(SELECT Neptun 

FROM Jogyok 

GROUP BY Neptun 

HAVING AVG(Jegy) 2? 4) Jótanulók 
WHERE Jegyek.Neptun " Jótanulék. Neptun (r) 
CROUP BY Tárgykód 
HAVING COUNTÁS) 5 COUNT(Jótanulók.Heptun) ; 


23. A kifejezés részlormulái logikai ,és" kapcsolatban állnak, ezért minden, a 
formulát kielégítő z( sorra igaz az ALMA (z(1) kifejezés, a biztonságos- 
ság deliníciójának 1. pontja teljesül. 

A V kifejezés moga egy (34) w(t) alakú formula, melyben a szabad változó 
2. w(t) s 701) — DJ A (1) 5 2A ALMA) (20). 


Az Tf] z 10011) kifejezés és az ezzel konjunkcióban (,és" kapcsolatban) 
álló ALMA DC) miatt csak DOAf (4)-beli elemek kerülhetnek az ered- 
ményhalmazba, melyet a t(!)(1] 5 2 tovább szűkít. Tehát a 2. pont is teljesül, 
a kifejezés biztonságos. 

Fontos, hogy a kifejezés biztonságossága független attól, hogy milyen reláci- 
ón értékeljük ki, ezért nern szükséges DOM (WV) meghatározása a feladatban 
megadott alma reláció mellett. 

24. A 
rusz (ő.b,c,d,e, foiR(a,b,c.d,e) A S(ab,.J.9)) 


13.5. Objektumorientált adatmodeli 
27. A típusok: 


Ujsag: TUPLE OF ( 
cím: String, 
foszerkeszto: Szemely, 
főszerkesztő helyettesek: LIST OF (sz: Szemely), 
rovatok: SET OF (r: Rovat) 
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Szezely: TUPLE OF ( 
nev: String 
) 


Rovat: TUPLE OF ( 
vezeto: Szenely, 
ujsagirok: SET OF (sz: Szemely) 


Látható, hogy a Szemely típus elhagyható lenne, hiszen csak egy attribútu- 
mot tartalmaz. Az objektumorientált tervezés miatt azonban célszerű külön 
típusként definiálnunk a szemantikai különválasztás és a későbbi bővíthető- 
ség érdekében. 


13.6. Fizikai szervezés 


31. 


32. 


33. 


Az adatállomány be — 10? blokkból áll, a sűrű indexhez 1.5: 10? blokkra, az 
erre épített ritka indexhez 7500 blokkra van szükség. 

Összesen 109 -4.1,5-1054-7,5. 10961 157 500 blokk. 

A felhasználható blokkméret 1520 bájt, az adatállomány 5-4 000 blokkból 
áll. 

Sűrű indexre épített 1 szintes ritka index: A sűrű indexhez 9000, a ritka 
indexhez 300 blokk szükséges. Ez összesen 54 000 -t 9000 -4- 300 — 63 300 
blokk. 

3 szintes ritka index: A ritkn index egyes szintjeinek tárolásához 1800, 60 
és 2 blokk kell. Összesen 54 000 -4- 1800 4 60 4 2 s 55 862 blokk, így ez a 
taknrékosnbb megoldás. 

Megjegyzendő, hogy a többszintes ritknindex-struktúra nem gyökeres fa, 
hiszen a legfelső szinten nem egyetlen csomópont található. 

ny — 109, 5, — 100 bájt,b 4000 bájt,ka — k2 — 10 bájt, 

p: 32 bít — 4 bájt, flokkművelet 7 5 m$ 

Egy blokkba 4; [ds] — [88] — 285 indexbejegyzés fér. 


1. Az intervallumkeresés támogatásának igénye kizárja a hash szervezés 
alkalmazását, valamilyen indexalapú szervezést kell használnunk. An- 
nak érdekében, hogy a keresés maximum 40 ms-ig tartson, legfeljebb 8 
blokkműveletet végezhetünk. 

Egy lehetséges megoldás, hogy az adatállományra a keresési kulcsoknak 
megfelelő sűrű indexeket építünk, majd ezekre egy-egy B"-fát. 

g 
A sűrű indexnek 109 bejegyzése van, ehhez [6] 3 508 772 blokkra 
van szükség. 
B"-fa esetén egy indexblokkba elhelyezhetünk plusz egy mutatót akkor 


is, ha a kulcsának már nem marad hely. Itt ezt ki tudjuk használni, mert 
285-(10 3-4) 4-4 — 3994, ezért a fa elágazási tényezője 286. Ahhoz, hogy 
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a sürű indexben keresni tudjunk, flogagg 3 508 772] — 3 szintű Bt-fára 
van szükség. Így egy rekord beolvasásához pontosan 341415 5 
biokkművelet szükséges, vagyis a keresés csak 25 ms-ot vesz igénybe. 
Vegyük észre, hogy a feladat megoldása során az adatállomány és a 
B".fa között található sűrű index által nyújtott indiírekció miatt eddíg 
nem szükséges az adatállomány blokkszámának meghatározása. 

2. A rekordok 896-a: 10? . 008 — 8 - 107 rekord. Feltételezzük, hogy az ál- 
lomány a keresési kulcs szerint nem rendezett (két kulcs esetén amúgy 
sem valószínű, hogy mindkettő szerint rendezhető). Ekkor mivel egy 
rekord kiolvasása 5 blokkműveletet igényel, az eredményül adandó re- 
kordok kiolvasásához (8 - 107) -5 — 4109 blokkművetetre van szükség. 
Ez 5 ms-es blokkműveletekkel számolva több mint 23 nap. 

A problémát az okozza, hogy mindig végig kel! menni a teljes index- 
struktúrán, Ötlet: ha a sűrű index blokkjait olvassuk végig (3 508 772 
biokkművelet) és az alapján olvassuk ki az adatállományból a 8 - 107 
rekordot, (3 508 772-4 8.107). 5 ms sz 4.8 nap alatt kiolvashatjuk an 
kercsett rekordokat. 

Meglepő módon akkor járunk a legjobban, ha egyszerűen végigolvassuk 
az adatállomány blokkjait. Egy blokkba fr z le] z 19] z 40 


sr 


9 
adatrekord (ér, ezért az adatállomány b. — [9] - jé m 25.107 


5 
blokkból 843. Ennek végigolvasásához , csak" (2,5-107)-5 ms sz 1,5 nap 
szükséges. 

36. ny — LOS s, 5 I10 bájt,b z 3000 bájt,k — 25 bájt,p z 64 bit — 

8 bájt, rekord max. 7 20 MS, Étdokkinövelet — 5 MS 

a) A feladat szövegéből tudjuk, hogy a vödörkatalógus belefér a memó- 
riába, czért egy rekord eléréséhez csak a hash függvény által kijelölt 
vödröt kel! végigolvasnunk. A rekordelérési idő max. 20 ms lehet, egy 
biokkelérés 5 ms-ig tart, tehát egy vödör legfeljebb 4 blokkból állhat. 
Legjobb esetben csak a vödör első blokkját kell beolvasnunk (1 blokk- 
művelet), legrosszabb esetben az összeset (4 blokkművelet). Az átlagos 
rekordelérési idő ez alapján: ttüag — si .§ ms — 12,5 ms. 
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Megjegyzés. Nem vettük figyelembe, hogy a vödrök utolsó blokkjai 
nincsenek tele, ezért az átlogolásunk nem teljesen pontos, Nézzük az 
alábbi példát! 


1. blokk 2. blokk 1. blokk 2. blokk 

a) cset b) eset 
Az a) esetben 5 rekordot tárolunk. Az első 4 rekord eléréséhez 1 blokk- 
műveletre, míg az 5. rekord eléréséhez 2 blokkműveletre van szükség. 
Ez átlagosan ss tani z 1.2 blokkműveletet jelent. A b? esetben 8 re 
kordot tárolunk, czért átlagosan £1ga2 z 1.5 blokkműveletre van 
szükség. A fenti módszerrel sz z 1,5 blokkműveletet kapunk. Mivel 
ez elhanyagolható eltérést jelent, de sok többletszámolást megtakarít- 
hatunk vele, megetégszünk a biokkonkénti számítással kapott pontos- 
sággal - egyébként is becslésekről van szó, a konkrét elérési idő sok 
más tényezőtől (ügg. 


b) Egy adatblokkba fp — lé] a 19] z 27 rekord fér, egy vödörben 


6 
4.27 z 108 rekord tárolható. Az állomány B — ff] s [66] z 9260 


vödörből áll, melyek címzéséhez 9260.8 s 74 080 bájt szükséges - ennyi 
helyet foglal a vödörkatalógus a memériában. 


c) Lásd a 34. feladatot. Itt § — pú Ax 108 5 1, tehát a vödrök számát 
a kétszeresére kell növelni, ehhez 74 080 bájt többletmemóriára van 
szükség - ennyivel lesz nagyobb a vödörkatalógus. Nézzük, hogyan hat 
ez a rekordelétési időre! 


B" sz 9260-2 sz 18 520 vödör esetén egy vödörbe [8] rekord kerül, 
ehhez [8] m [8 sz 2 blokkra van szükség vödrönként. 
Az átlagos rekordelérési idő: tattag — 132 "5 ms — 75 ms. 
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13.7. Funkcionális függések 


41. Vizsgáljuk meg, hogy A, B,€ attribútumok esetén milyen nemtriviális füg- 


42. 


gőségek állhatnak fenn! 
A függőségek bal oldalán legfeljebb 3 attribútum állhat, de 0 és 3 attribútum 
esetén csak triviális függőségek írhatók fel: 0 — 0, ill. ABC — ..., ahol a 
jobb oldalon ABC tetszőleges (akár üres) részhatmaza állhat. Így azokat az 
eseteket kell megvizsgálnunk, ahol a bal oldalon 1 vagy 2 attribútum áll. 
Bal oldalon egy attribútum 

045 BAT 

0 864 B-C 

060053 4ACG GB 
Ezen függőségek megsértésére léteznie kell olyan sorpároknak, melyeknek 
vannak olyan soraik, hogy az adott attribútumban megegyeznek, a többiben 
viszont különböznek. 


1 0 


BIC 
1 
1 


—mf-jolm 


Látható, hogy a példa első 3 sorában vannak A-ban, B-ben, ill. C-ben azonos 
sorok, melyek rendre megsértik a felsorolt függőségeket. 
Bal oldalon két attribútum 

90 AB-€ 

o 4€2 B 

o B0—a A 
Az eddigi példában nem sérti ezeket a függőségeket egyik sorpár sem. Ahhoz, 
hogy ezt a 3 függőséget megsértsük, olyan sort kell felvennünk, amelynek van 
AB-ben azonos, de C-ben különböző, AC-ben azonos, de B-ben különböző, 
BC-ben azonos, de A-ban különböző párja: 





Erre az rí Jt) relációra nem teljesül semrnilyen nemtriviális funkcionális füg- 
gés. 
a) 1. Felbontjuk a függőségeket úgy, hogy a jobb oldalakon egy attribú- 
tum legyen: 


F" -(X2o B.XZOGXZoY,XZO3Z AY OC 
4YOGC-o W Bo 6) 
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2. XZ.5 Z triviális, ezért elhagyható (ha precízen követjük az algo- 
ritmust, először a bal oldalát 2-re redukáljuk és csak a 3. lépésben 
hagyjuk el a Z 5 Z függőséget). 


F"-(XAZ22 B.XZOGAZOGYAYOC AYOG, 
Ca WW.BoG) 


3. XZ a G elhagyható, mert (XZDY(FNM(XZOG) - 
(XZBGY) 3 G. 


F"2:í1XZ25 B.XZOYAYOCAYOG CG WBOG 


6) Igaz-e, hogy AAZ 5 BYE Ft? 
Attribútumhbalmaz lezártjának meghatározásával. 


(AXZY" (PF) - (AXZBGYCOW) 3 BY, 


ezért AAZ a BYE FT 
Következtetéssel. Az eredeti föggéshalmazzal dolgozunk: 


F - (XZ- BGYZ,AY— CG.C— W BO 6). 


Az első függőséget a bővítési nxióma alapján mindkét oldalon az 
A attribútummal bővítjük; AXZ 5 ABGYZ. Ebből a dekompozí- 
ciós szabály felhasználásával adódik, hogy AXZ a BY. Tekintve, 
hogy a kérdéses függést formálisan le tudtuk vezetni az Armstrong- 
nxiómák, ill. arra visszavezethető szabály felhasználásával, ezért az 
Armstrong axiómák tulajdonságai (ami levezethető, az igaz, és vi- 
szont) miatt az állítás ígaz. 
43. a) igaz 
b) nem igaz . 
"44. A 4l. feladat megoldásánál beláttuk, hogy az R(A, B, C) relációs séma cse- 
tén az alábbi funkcionális függőségek állhatnak fenn. 
Bal oldalon egy attribútum 
045 BAGC 
0 BO-A4ABo€C 
90054 CGB 
Bal oldalon két attribútum 
0 Ba €C 
o AB 
o BCa A 
Próbáljuk meg kizárni a bal oldalon két attribútumos függőségeket. Ezt úgy 
tehetjük meg, hogy olyan sorokat veszünk fel, hogy lesznek olyan tt e rí) 
sorpárok, melyek: 
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o AB-ben megegyeznek, de €-ben nem, 
o AC-ben megegyeznek, de B-ben nem, 
o BC-ben megegyeznek, de A-ban nem. 


Ehhez szükség van (legalább) két olyan sorra, amelyek AB-ben megegyez- 
nek, de C-ben nem. Ezután olyan sorpárt szeretnénk, melynek sorai 4C€-ben 
megegyeznek, de B-ben nem. Mivel az előző két sor C-ben különbözött, új 
sorpárt kell keresnünk. Összesen 3 sorból gazdálkodhatunk, ezért csak egy " 
új sort. vehetünk fel — ennek AC-ben egyeznie kell valamelyik korábbi sorral. 
Ebből viszont következik, hogy mindhárom sor ugyanazt azt értéket veszi 
fel az A attribútumon. Tehát a BC —a A funkcionális függést sértő sorpárt 
nem tudunk felvenni. 





Adott 3 soros r reláció tehát nem tudja az összes lehetséges funkcionális 
függőséget sérteni, így mindig meg lehet adni olyan nemtriviális funkcionál 
függést, amely az adott rcláción fennáll. 

Megjegyzés. Nem kell, hogy az adott funkcionális függőségnek megfelelő 
sorok megjelenjenek r-ben. Lásd a 9.2.3. Funkcionális függőségek alszakasz 


1. megjegyzését: ,Ha soha nincsen két t,t" sor, az X a Y függés akkor is 
fennállhat!" 





13.8. Normálformák 


47. Az ft relációs séma legmagasabb normálformája az INF. 

48. Az R relációs séma legmagasabb normálíormája a 3 NF. 

49. R nem BCNF, tehát van egy olyan nemtriviális X — A függőség, amire X 
nem szuperkulcs, A £ X. Mivel X nem szuperkulcs, van legalább egy olyan 
B attribútum, amít nem határoz meg. Ebből X € RV AB, biszen sem A, 
sem B nem lehet X eleme. 
Az X — A függőségben vegyűk X-hez az összes olyan elemet R) 48B-ből, 
ami még nincs benne. Az így kapott függőség éppen az, amit kerestünk, 
hiszen a bal oldalt addig alakítottuk, amíg nem lett R4 AB-vel egyenlő. 
A kapott (függőség ígaz, hiszen X meghatározta A-t, ezt pedig nem tudjuk 
elrontani azzal, hogy új elemeket veszünk hozzá a függőség bal oldalához. 
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Megjegyzés. Az utolsó állítás a bővíthetőségi és a dekompozíciós szabály 
közvetlen következménye. P — 0 esetén PS o 0), hiszen először 5S-sel 
bövítünk mindkét oldalon, tnajd a kapott függőség jobb oldalát felbontjuk. 





13.9. Relációs sémafelbontás 


51. Egy séma BCNF-ben van, ha minden nermtriviális X — A függés esetén 
X szuperkulcs. Nem szükséges A minden szuperkulcsát meghatározni, elég 
megvizsgálni, hogy a függések bal oldali attribútumhaknazainak lezártja 
visszandja-e n teljes relációs sémát. 

o (ABJY(F) - (ABC) 4 R 

o (DJY(F)-(DAJÁÉR 
Láthntó, hogy AB a Cés D 6 A sértik an BONF feltételt, mert AB és 
D nem szuperkulcsok. Egy relációt BCNF-be veszteségmentcsen úgy bont- 
hotunk fe), hogy a BCNF tulajdonságot sértő X 5 Y € Ft függőségek 
mentén ft sz XY és f2- RNY sémákat hozunk létre. 


o Az R sémát AB 5 €C mentén felbontva: fh(ABC), R3(ABDE). 
A függöségeknek egy Z C ft attribútumhalmazra való vetítése a 
sz(F) s (xayIXGYeFt és XYG 2). Fontos, hogy először 
készítsük el nz függéshalmaz lezártját, ezután végezzttk el a vetítést 
- fordított sorrendben csak a vetített függéshalmaz egy részhalmazát 
kapjuk. 

Az Ry-re vetített függőségek meghatározásához kiszámítjuk az attribú- 
temhalmaz összes lehetséges valódi részhalmozának F függéshalmazon 
vett lezártjait: (A)t, (B)t, (OT, (Agyt, (mot, (BOT, (ABOJT 
Ez alapján 5 s (AB6 €).(AB)T(F) z (ABC) — Ri, tehát AB 
szuperkulcs és fa BCNF. 
Az f2-re vetített függőséghalmaz meghatározásához kiszámítjuk az 
attribútumhalmaz összes lehetséges részhalmazának F függéshelma- 
zon vett lezártjait: (APT, (B)t, (DD, (EJT, (AB)T, (ADJT, (AEJT, 
(DDT, (BE), (DEJT  (ABDJ)T, (ABEJT, (ADE)t , (BDEDT , 
Csak azokat a lezártakat fejtjük ki, amik bővítik a vetített F3 függés- 
halmazt: 
1. (DJ (F)-(DAJ) 5 DO Ae F 
2. (AEJY(F)- (AEBCD) 5 AE— BDE F; 
3. (BD)Y(F) - (BDACE) 5 BD- E€c FP(BD- A € FZ az 1. 
pontban szereplő D — A miatt) 
4. (BEJT(F) z (BEDAC) 5 BEG DE F2(BE- A c Ff a4. 
pontban szereplő BE 5 D és a 1. pontban szereplő D — A miatt) 
A vetített függéshalmaz EF; — (Da A, ABG BD. BD- E,BEG D). 
Vegyük észre, hogy ha először vetítettűnk volna, és utána képzünk le- 
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52. 


zártat, csak a (D 5 A, AE— B, BE—a D) C F; függéshalmazt kap- 
juk, amiben nem szerepel a BD 3 £ függés. 

Vizsgáljuk meg, hogy a kapott séma BCNF-e. (D)t(F2) - (DA) A 
ft, tehát a D 5 A függőség továbbra is sérti a BCNF tulajdonságot, 
ezért tovább bontjuk: /. Megmutatható, hogy mindkét séma BCNF, 
tehát a pr( ABC, AD, BDE) felbontás minden sémája BCNF. 

a Az R sémát D G A mentén felbontva az px(AD, BCODE) felbontást 
kapjuk, melynek részsémái BCNF-ek (a részletes levezetéstől eltekin- 
tünk). 

a) A felbontás a (MO, NOM, LNOP). 

b) Csak a po(tAfOo, LAMNOP) felbontás megoldása a feladatnak. Ez 


deti sémát is. 


53. A könnyebb számítás érdekében határozzunk meg egy minimális függéshal- 


mazt. 

1. F2(AG BACO BACO DC A CODAFPO E AFP CC 
AFo B). 

2. CG A miatt az AC— B függőség bal oldaláról elhagyható A, A a B 
miatt az AF — B függőség bal oldaláról elhagyható F, C a DB miatt 
az AC— D bal oldaláról elhagyható A, így 
F"2(A6 BC6BCGAC GOD AFG E,AFa €). 

3. Ca 4 6s A— B miatt C — B elhagyható, így 
F" (AG BCo AC DAPOEAFPOC 

Az F attribútum csak függőségek bal oldalán szerepel, tehát mindenképpen 
eleme a kulcsnak. Ft(F)-(F)  R, ezért bővítenünk kell. A B, Dés E 
attribútumokkal nem érdemes bővíteni, mert csak függőségek jobb oldalán 
szerepelnek, AF és CF viszont kulcsok. 

Egy séma akkor 2NF, ha INF és minden másodlagos attribútuma a séma 
bármely kulcsától teljesen függ. Itt az 4 - B ésa C — D függőségek sértik 
a 2NF tulajdonságot, mert AC AF és Cc€CF. 

A feladat többféle módon is megoldható, az egyes módszerek különböző 
mértékben jó megoldást adnak. 


3NF-re bontó algoritmussal. Tudjuk, hogy ha egy séma 3NF, akkor 


2NF is. Alkalmazzuk a 3NF-re bontó algoritmust az AF kulccsal, ami 
függőségőrző és veszteségmentes felbontást garantál: 


R1 (AB) , R2 (AC) , R3(CD) , Ra (ACF) , R5(AEF) , RG(AF) . 


Látható, hogy AG elhagyható. Így a felbontás or(AB, AC, CD, ACF, 
AEF), vagyis öt 3NF sémára bontottunk (amelyek egyben 2NF-ek is). 
A sémák számát a részsémák összekapcsolásával lehet csökkenteni. 

Belátható, hogy ha egy (ft, R2,..., Rn) felbontásból töröljük 
az Ai, HR; sémákat és hozzáadjuk az HU R; sémát, akkor a 
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A (R, Ra... Ron Biads e er Rjon Rali ss An HU R;) felbontás 
megőrzi st veszteségmentes, ill. függőségőrző tulajdonságát. 
Veszteségmentesség bizonyítása: t. [. h. gs veszteségmentes, de A nem az, 
vagyis a A-beli sémákra illeszkedő relációk összekapcsolásakor új sorok 
keletkezhetnek. Vagyis 30 € mi(r) ( £ mu(r). 3t € mi (r) miatt 
t(RGUR-] € TRUR; (r), de eg UR) € 7, (r) 4 AR; (r). Ez viszont 
ellentmondás, mert a természetes illesztés tulajdonságni miatt t(RGUR5] 
biztosan megjelenik 7p; (r) x TR; (r)-ban is. Tehát A veszteségmentes, 
Függöségörzőség bizonyítása: triviális. zt akkor függőségőrző, ha a rész- 
sémáira vetített függőségek uniójából levezetbető az eredeti függéshal- 
maz minden függése, Az R;, R;-re vetített függőségek mindegyike sze- 
repel az HU R;-re vetített függéshalmazban ísőt, bővebb is lehet), 
tehát a A felbontás függőségőrző, ha pt függöségőrző volt. 
A fenti ötlet alapján lehet próbálkozni a részsémák unióját képezve 
csökkenteni a felbontásban szereplő sémák számát. Természetesen min- 
den lépés után ellenőrizni kell, hogy a kapott részséma még 2NF-ben 
van-e. Látható, hogy öt részséra esetén a részsémák uniójának összes 
lehetséges kombinációjának kipróbálása rendkívül időigényes feladat. 
Módosított 3NF-re bontó algoritmussal. A 3NF-re bontó algoritmus 
esetén a függéshalmaz minimalitására csak a 3NF tulajdonság bíztosi- 
tásához van szükség (Id. a tétel bizonyításában). Próbáljunk egy olyan 
függéshalmnozt alkotni, amely ckvívalens az eredetivel, de minél keve- 
sebb függőséget tartalmaz. Ilyen pl. az 


Fz(A5 BC 6 AD,AFo CE). 


Ez alapján a felbontás fi(AB), R2(ACD) , R3(ACEF), R4(AF), 
amiből fty elhagyható: 


Rt(AB) , R2(ACD) , R3(ACEP). 


Mivel nem minimális függésbhalmazból indultunk ki, meg kell vizsgál- 
nunk, hogy milyen normálformában vannak a felbontás részsémái. fi 
kételemű, tehát BCNF. Az ft2-re vetített függéshalmaz meghatározásá- 
hoz határozzuk meg az AÁCD attribútumhalmaz lehetséges részhalma- 
zainak (A, C, D, AC, AD, CD, ACD) lezártját. Mivel D csak függöség 
jobb oldalán szerepel, elég az At (F J ect (8), ACT (6) lezártak 
meghatározása. A vetített függéshalmaz: (C — AD), a séma BCNF. 
Az ftz:ra vetített függéshalmazhoz az ACEF lehetséges részhalmazait 
kell meghatározni. Tudjuk, hogy E csak függőség jobb oldalán szerepel, 
ezért elég az (A, CP, AC AF, CF, ACF) attribútumhalmazok lezárt- 
jának meghatározása. 


o At(P) -(4B) 
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o CFt (P) - (CFABDE) 
o ACFY (e) z (ACFBDE) (tartalmaz kulcsot). 


A vetített függéshalmaz: (C 5 A, AF—G CE, CF a AE), a kulcsok AP 
és CF, az egyetlen másodlagos attribútum az E. A séma 2NF, mert 
minden másodlagos attribútuma a séma bármely kulcsától teljesen 
függ. A felbontás po( AB, ACD, ACEF), tehát három sémára bon- 
tottunk. Próbáljuk , összeilleszteni" a sémákat az előző pontban leírtak 
alapján, a részsémák unióját véve, 

1. poa( AB, ACODEF): Vizsgáljuk ACDEF-et. D biztosan másodla- 
gos attribútum, mert az eredeti függéshalmazban sem szerepel füg- 
gés bal oldalán (de szerepei olyan nemtriviális függés jobb olda- 
lán, melynek minden attribútuma szerepel a részsémában), CF 
(az egyik) kulcs, CG D eleme a vetített függéshalmaznak. D nem 
függ teljesen a CF kulcstól, czért a séma nem 2NF. 

2. pr ((ABCEF, ACD): Vizsgáljuk ABCEF-et. B biztosan másod- 
lagos attribútum, mert az eredeti függéshalmazban sem szerepel 
függés bal oldalán (de szerepel olyan nemtriviális függés jobb ol- 
dalán, melynek minden attribútuma szerepel a részsémában), ÁF 
(az egyik) kulcs, A — B cleme a vetített függéshalmaznak. B nem 
függ teljesen az AF kulcstól, ezért a séma nem 2NF. 

3. p2-(ABDOCD, ACEF): Vizsgáljuk ABCD-t, Mivel D a vetített (üg- 
géshalmazban is csak C-től függhet, C minden szuperkulcsnak ele- 
me kell, hogy legyen. C szuperkulcs és minimális, ezért kulcs is, 
következésképpen az egyetlen kulcs. Mivel minden kulcs egyszerű, 
a séma 2NF. ACEF-ről korábban beláttuk, hogy 2NF, a felbontás 
tehát megoldása a feladatnak. Mivel az eredeti ft séma nem 2NF, 
ez a két részsémára történő felbontás minimális. 

BCNF-re bontó algoritmussal. A BCNF-re bontó algoritmus veszte- 
ségmentes, de nem biztos, hogy a kapott felbontás függőségőrző. Az 
algoritmust úgy használjuk, hogy a 2NF tulajdonságot sértő X -s 
Y függőségek mentén RY Y és XY sémákra bontjuk a relációt. 

Az A — B függőség mentén a felbontás: 1 (AB) és RA(ACDEF). 
Látható, hogy R) BCNF, mert két attribútuma van. Az f2-re vetített 
függőségek halmazában az (C 5 AC 5 D,AFP5 CAF 5 E) függő- 
ségek szerepelnek. AF és CF R2 szuperkulcsai és minimálisak, mert F 


3 Ellenőrizhető, hogy fiz pontosan $NF normálformájú. 
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csak függés jobb oldalán szerepel, de önmagában nem kulcs. A felbon- 
tás függőségőrző, mert A — B Ri-re, a többi függőség ft2-re vetítve 
megjelenik. 
A kulcsok részhalmazni közül C-től függ a D másodlagos attribútum, 
A elsődleges attribútum, ezért C 6 A nem, de C 5 D sérti a 2NP 
tulajdonságot. További felbontás: R3(CD), R(ACEF). Ra 2NF (sőt 
BCNF), Ry-ről pedig korábban beláttuk, hogy 2XT. A felbontás függő- 
ségörző, mert C 5. D ffgere, a többi függőség Ry-re vetítve megjelenik. 
A felbontás: oz(AB, CD, ACEP), tehát károm részsémára bontottunk. 
Az előző megoldáshoz hasonlóan itt is megkaphatjuk a 9 felbontást. 
Intuitív megoldás. Próbáljuk meg két 2NF részre felbontani a sémát! Eh- 
hez alkossunk egy olyan részsémát, amelyben már nincs összetett kulcs, 
Legyen pl. ky - Ct(F) - (ABCD). Ezen a sémán C az egyetlen 
kulcs, hiszen az eredeti függéshalmazban C csak AF-iől függ, F nem 
szerepel függőség jobb oldalán, vagyis egy fty-beli attribútumhalmaz 
lezártinként nem állhat elő. Mivel minden másodlagos attribútum bár- 
mely kulcstól teljesen függ, a séma 2NF. 
A másik részséma legyen olyan, hogy AF és CF egyik részétől sincs 
függés, azaz n 2NF tulajdonságot sértő függőségek jobb oldalán szeren 
lő attribútuntokat (B, D) elhagyjuk. Így R2 s (ACEF). Korábban 
beláttuk, hogy ACEF 2 NF. 
Meg kell vizsgálnunk, hogy ez n felbontás veszteségmentes és 
függőségőrző-e. 
Tudjuk, hogy egy felbontás akkor (és csak akkor) veszteségmentes, ha 
(R1n.R2) 5 (NR) e Pt vagy (RO. R2) a (Rh) € FT. 
itt RN.hs s (AC) RA Ra - (BD), RA R — (EF). Mive F 
nem szerepel függés jobb oldalán, ezért AC a BD-t érdemes vizsgál- 
ni. (AC)t(F) - fABCDJ), czén AC — BD € Ft, azaz a felbontás 
veszteségmentes, 
Már csak ozt kell ellenőriznünk, hogy a felbontás függőségörző-e. Eh- 
hez vegyük azon függések unióját, amelyek csak olyan attribútumokra 
vonatkoznak, amelyek a részsémában benn vannak. Fontos, hogy ek- 
kor a vetített függéshalmaznak csak egy részhalmazát kapjuk - ha már 
ezek uniójából következik az eredeti függéshalmaz minde függése, a 
felbontás biztosan függőségörző, ellenkező esetben további vizsgálatok 
szükségesek. 
F3 (106 A AFP EG 


Fr ur; (A B.ACo DB. Cs AD CG A AP EG 
Ff-(4A65BACOo DB Ca AD) 


tartalmazza a minimális függéshalmaz összes függőségét, a felbontás 
függőségőrző. 

A felbontás: ps(ABCD, ACEF), tehát egy lépésben sikerült megtalálni 
a két részsémából álló minimális megoldást. 
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54. A felbontások: P(GHI, GJ, HKLEG) vagy T(IGHI, GJ, HKLI). 
55. Lehet. 
57. A feladat megoldása többféle módon is lehetséges. 


Táblázatos módszerrel. Vegyük fel a részsémáknak és az attribútumok- 
nak megfelelő táblázatot. 


ATBICIDIEIFPIG 


ACEFG jelt jajbi][ jaja] a 
BCDE [d]a[lala[la[to]tb 


C€C5 FésE2 G alkalmazása után az alábbi táblázatot kapjuk. 


AIBICIDÍEIFIG 


ACEFG KECEKSUUKNKZ a 
BCDE [It ala a 


Ezen az F 5 (AB C AC D CG F,D5 B, E— 6) függöséghal- 
maz egyik függőségét sem tudjuk alkalmazni, ezért a táblázatnak nincs 
csupa a sora, tehát a felbontás nem veszteségmentes. 

Tétel felhasználásával. Egy p(f1, R2) felbontás akkor és csak akkor vesz- 
teségmentes, ha (RIN.R2) - (MAR) e Ft vagy (RYONR2) 5 
(Ra) e Ft.IttMNnR2 zs CE, RgXIt - AFG és Re) zs BD. 
(CEJt(F) - (CEFG), ezért egyik sem CE a AFG, sem CÉ 5 BD 
nem eleme Ft-nak, 

Ellenpéldával. Egy konkrét, az f sémára illeszkedő reláció: 


AJIBICIDIEIFIG 


alj jeldle[1]9 
azlb ic] ]doje[Í[9 


(A reláción teljesülnek az F függéshalmaz funkcionális függései.) 


Felbontása: 
AlCcCIElIFIG BICIDI]E 
ajcle[lf]9 bhjeld[e 
azjc[leljil9 boleld[e 


A két részreláció természetes illesztése: 








Látható, hogy az eredeti relációhoz less új sorok keletkeztek, ezért a 
felbontás nem veszteségmentes. 
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13.10. Tranzakciókezelés 


62. Az ütemezés sorosítható, soros ekvivalense: TXT3T1T4- 
63. Az ütetnezés nem sorosítható, mert nincs olyan soros ütemezés, amellyel 


67. 


. 


minden hatása ekvivalens lenne. Ugyánis az ütemezés lefutásakor az A adat- 
egységet a Th, a B adategységet an 75 tranzakció módosította utoljára. A 
saros ütemezések közül T)75 lefutása után mindkét adategységet T5, a TT) 
lefutása után mindkét adategységet Ti módosította utoljára. 

Az ütemezés precedenciagráfja bármilyen legális zárolással - pl. ha minden 
WRITE X utasítást a LOCK X, WRITE X, UNLOCK X utasítássorozatra 


cserélünk -— az niábbi lesz: 
0 Og 


Kétfáózisú rendszer csetén: tudjuk, hogy há egy legális ütemezés mindegyik 
tranzakciója 2PL protokollt követi, nkkor az ütemezés sorosítható. Ebből 
következik, hogy ha egy ütemezés nem sorosíthntó, akkor nemi tartozhat 
hozzá Jegális, 2PL tranzakciókból álló ütemezés. 


. A tranzakció 2PL, de nem szigorú, A két sor feleserélésével n tranzakció 


szigorú 2PL lesz. A protokoll sorosíthntóságot és Invinamentességét biztosít. 


LOCK A 


zárpont 


COMMIT 
kész pont 
WRITE A 





írások vége 
UNLOCK A 


Az ütemezés lefutása: 


si 





Az ütemezés első közelítésben nem sorosítható, mert a (3) lépésben a 
WRITE A abortot okoz t(7) c IV(A) miatt (Id. 10.9. Időbélyeges tranzak- 
ciókezelés R/W modettben alszakasz (6) megjegyzése). 

Ennek ellenére, ha a T tranzakció írni szeretné az A adategységet R(A) c 
t(T) c W(A) esetén, a tranzakciót nem feltétlenül kell abortálni, ekkor az 
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időbélyegeket nem kell módosítani, elég csak az írást elhagyni. Ezt Thomas 
írási szabálynak (Thomas" Write Rule) nevezzük. 

Az első pillanatban meglepő állítás azt a megfigyelést használja kí, hogy 
ebben az esetben az A adategységet már írta egy később indult [ tranzakció 
(t(T) c t(U)). Ha később egy A-t olvasni próbáló V tranzakció IV(4) — 
t(U)-nál kisebb időbélyegű, akkor t(V) c W(A) miatt abortálni kell, míg 
ha W(A)-nál nagyobb időbélyegű, akkor az [/ által írt értéket kell olvasnia 
- egyik olvasásnál sincs tehát szükség a T által írt értékre. 

Fontos, hogy a Thomas írási szabályt csak akkor használhatjuk, ha a ma- 
gasabb időbélyegű tranzakció már committált. Gondoljuk végig, hogy mi 
történik, ha a fenti példában 72-nek további műveletei is vannak és a T) 
tranzakció A-n történő írásakor úgy alkalmazzuk a szabályt, hogy T2 még 
nem committált. Ekkor lehetséges, hogy Ti commitja után T2 egy későb- 
bi művelete miatt abortál, így az A adategységnek a (már commitált) Ti 
tranzakció írását kellene tükröznic, amit azonban korábban kihagytunk. 

A probléma egy lehetséges megoldása, hogy minden adategységhez (X) ren- 
delünk egy C(X) commit bitet, ami alapértelmezésben ígaz értékű, A C(X) 
bitet akkor állítjuk be tamisra, ha egy írást a munkaterületen elvégeztünk, 
de a tranzakció még ném committált. C(X) - hamis csetén az adategységre 
irányuló további olvasásokat írásokat várakoztatjuk, amíg C(X) igaz nem 
lesz vagy az X-et legutoljára író tranzakció nem abortál. 

Ha az X-et legutoljára író tranzakció - ami miatt C(X) hamis értékű - 
committál, az ütemező a C(X) bitet igazra állítja; ha abortál, vissza kel! 
állítani X korábbi értékét és a W(X) időbélyeget, majd az X-re váró tranz- 
akcióknak újra meg kell ismételniük az olvasásifírási kísérletüket. A commit 
bit használata megszünteti a piszkos olvasások és a Thomas írási sznbállyal 
felmerülő inkonzisztencia lehetőségét, mert így csak committált adategység- 
re alkalmazhatjuk a szabályt, különben C(X) 5 hamis miatt a tranzakció 
várakozásra kényszerül. 

Vegyük észre, hogy a commit bit működése megegyezik a 10.9.3. Tranzak- 
cióhidák és az időbélyegek c. részben használt zárakkal. 

A fenti példában a Thomas írási szabályt alkalmazva - tehát a (3) lépés- 
ben az írás műveletet elhagyva, az időbélyegeket változatlanul hagyva és a 
tranzakciót neim abortálva - a kapott új ütemezés hatása bármely konzisz- 
tens adatbázison ekvivalens lesz a Ty, 72 soros ütemezéssel: 





T2 
a READ A 
zi WRITE A 
WRITE 





A Thomas írási szabállyal tehát találtunk egy olyan trükköt", amivel 
úgy transzformálhatunk bizonyos nem soroósítható ütemezéseket, hogy vé- 
gül mégis legyen hozzá soros ekvivalens ütemezés. 
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